名大ら,マルチモーダル対話型自動運転車を開発

名古屋大学は,徳島大学,アイシン精機と共同で,自動運転オープンソースソフトウェア「Autoware」を利用し,音声認識・顔画像認識・ジェスチャー認識を組み合わせたマルチモーダルインタフェースで,自動車を直観的に操作するシステムを開発した(ニュースリリース)。

近年,自動運転車の研究開発は急速に進展し,日米で公道において走行実験が行なわれるようになった。しかし,自動運転のための周囲のセンシングや車の制御などの技術は進展しているものの,実際に一般の人が自動運転車に乗り込み,目的の場所に移動するために,どのように「自動運転車を操作する」のかについての検討はあまり行なわれてこなかった。

自動運転車が真に社会に浸透し,一般の人が容易に利用できるようにするためには,自動運転車と人とのコミュニケーションが必要。その自動運転車のインタフェースの一つの理想形がタクシーだとする。

乗客は運転手に行き先を告げ,必要に応じて曲がる場所などを伝え,行き先に来たら停まってもらう,このようなやり取りは,音声による対話を中心に,ジェスチャーなどを交えながら交わされる。このやり取りを自動運転車との間でできないかという期待が持たれてきた。

今回研究グループは,音声対話を中心とし,ジェスチャや視線も情報伝達手段として用いることのできる,「人対人のコミュニケーション」から発想を得た「自動運転車用マルチモーダルインタフェースシステム」の開発に取り組んだ。

このシステムは,人(ユーザー)の音声,ジェスチャー,視線などはそれぞれ音声認識,深度センサー,映像処理を用いて認識をする。例えば,ユーザーが「右に曲がって」と発声すれば,システムはユーザの意図に従って,自動車に右に曲がるように制御を依頼し,実際に自動車は右に曲がる。

一方,音声とジェスチャーや視線を同時に用いる場合,それらの入力は並行して行なわれるので,ユーザーが自動運転車に伝えようとする「意図」はそれらを統一して理解する必要がある。例えば,ある建物を見ながら「あれは何?」と尋ねれば,「あれ」と言っている時にユーザーが見ている建物の名称を答えてほしい,という意図の理解が必要。

このような各入力手段(モダリティ)の時間的関係も考慮しながら,マルチモーダル理解を行ない,その意図に応じて応答し,車を制御するマルチモーダルインターフェースを備えた自動運転車を開発・実現した。

研究グループは今後,自動運転車に限らず,機械と人間の協調・共生を考えた場合,マルチモーダルインターフェースは自然で使いやすいインターフェースとして取り入れられていくと期待している。

キーワード:

関連記事

  • 大成建設、自動運転をインフラから支える位置推定補正の新技術を開発

    大成建設は、自動運転レベル4の社会実装の拡大を見据え、トンネル内など特徴の少ない区間で生じやすい走行方向の車両位置の誤差を、インフラ側から効果的に補正する位置推定技術「T-Localizer」を開発した(ニュースリリース…

    2025.12.22
  • 「 NTTモビリティ」設立 2028年にレベル4の自動運転サービス目指す

    NTTは、将来の自動運転社会の実現を目指す事業会社「NTTモビリティ」を12月15日付で設立し、同17日に報道関係者向けにその事業内容などについて会見を行なった。 NTTモビリティの社長に就任した山下航太氏は、交通の担い…

    2025.12.17
  • 鹿島とSUBARU,ファイバセンシング自動運転の実証実験開始

    鹿島建設とSUBARUは,2025年日本国際博覧会(大阪・関西万博)会場へのアクセス道路として使用されている高速道路において,大阪市の協力のもと,アスファルト舗装の内部に光ファイバセンサケーブルを敷設し,光ファイバセンシ…

    2025.06.27
  • 2035年ADAS搭載台数,日米欧中で約8400万台に

    矢野経済研究所は,ADAS/自動運転システムの世界市場の調査を実施し,市場概況や採用動向,個別メーカーの事業戦略を明らかにし,2035年までの新車におけるADAS/自動運転システムの世界搭載台数を予測した(ニュースリリー…

    2025.03.06
  • 慶大ら,走行中のLiDARシステムを長距離から無効化

    慶應義塾大学と米カリフォルニア大学は,自動運転車両のLiDARセンサーシステムにおける新たな脆弱性を発見した(ニュースリリース)。 LiDARセンサーは,高精度な3D空間認識能力を持つことから,多くの自動運転システムに採…

    2025.03.03

新着ニュース

人気記事

編集部おすすめ

  • オプトキャリア