声を出さずにボイスコマンドを発動す...

03
10

声を出さずにボイスコマンドを発動する「顎カメラ」とは

私「…………」Siri「ブリトニーのベストヒットを再生します」

人工アシスタントって便利ですよね。音声認識でタスク頼めるのって、アシスタント感が強くて慣れるとすっごく楽ちんです。が、しゃべれないシーンってけっこうありません? 単純に隣で誰か寝てるとか、リモート会議中だとか。あとは、周りに秘密で頼みたいこととか…。

もしかしたら、喋らなくてもボイスコマンドが使える日が来るかもしれません。コーネル大学が開発する「顎カメラ」があればね。

声を出さずにボイスコマンドを発動する「顎カメラ」とは

顎の動きから発声を読み取る

コーネル大学のアシスタントプロフェッサーCheng Zhang氏と博士課程学生Ruidong Zhang氏が研究開発を行なっている「SpeeChin」は、首からさげるカメラです。

ぶら下がったカメラは上向き、つまり顎の方を向いており、タスクを声に出さずとも口パクする顎の動きを読み取ってコマンドを発動するという仕組みになっています。カメラで顔を写し口の動きを読むのと何が違うのか? まさにSpeeChinのユニークさはそこにあり、下から顎の動きを読むので顔をキャプチャせずにすむ=プライバシに配慮できるというわけ。

SpeeChinの実験には20人が参加。10人は英語で54の簡単なフレーズ(数字や人工アシスタントの基本タスクなど)を試し、残り10人は中国語で44のフレーズを実験。結果、トレーニング期間を経て、SpeeChinの精度は英語で90.5%、中国語で91.6%まであがりました。

ただ、座ってじっとしての無言コマンドでの精度であり、歩きながらなど動作がからむとSpeeChinの精度は著しく落ちてしまうとのこと。まだまだ研究は初期段階で、問題は山積みなのでしょうが、面白い&もしかしたらSiriやAlexaがより便利になるかもしれない研究ですね。

Amazon