富士通,PCやタブレットの単眼カメラでより複雑な操作が可能な3次元ジェスチャー認識技術を開発

富士通研究所と富士通研究開発中心有限公司は,PCやタブレットなどに搭載された一台(単眼)のカメラで撮影した映像から上下・左右方向の手の動きだけでなく,奥行き方向の手の動きも検知する3次元ハンドジェスチャー認識技術を開発した。

従来のハンドジェスチャー認識技術では,マウスのカーソル移動に相当する上下・左右方向の手の動きは検知できたが,クリック操作に相当する手を前に押し出す動きの検知は困難だった。今回,手のひらモデルをもとに正確かつ高速に手の領域を検出する技術と,手の奥行き方向の動き検知技術を開発することで,直感的な動作である「押す」ジェスチャーによるクリック操作を実現した。

1

この技術により,例えばPCから離れた場所でも,端末のメニュー選択を上下の手振り操作で行ない,メニューの決定を「押す」操作で行なったり,地図などの画面の拡大・縮小を「押す」「引く」の操作で実現できるなど,ハンドジェスチャーでより複雑な操作が可能になる。

今回開発したのは以下の2つ。

1.手のひらモデルに基づく手の領域検出技術

手のひらの映像の中にあらかじめ登録してある手の特徴データが存在するかを算出。この操作をブロックの位置とサイズを変えながら画像全体に対して実施することで手の位置とサイズを特定する。さらに色の閾値を変えながら手の領域を確定する。

2.手の大きさの変化に基づく奥行き検知技術

時々刻々と変化する手の大きさ,角度,中心位置を手の動きの連続性を用いて高精度に推定し,「押す」「引く」の動作を約90パーセントの精度で検知する。

詳しくはこちら。