声と視線でクルマと対話する技術
クルマはただの移動手段ではなくなる
2019年11月から12月にかけてセレンス・ジャパンは、次世代技術のメディア向けデモを数度にわたって開催した。そのときに発表された人とクルマのコミュニケーション技術「セレンス・マルチモーダルPOC」を取材したので紹介する。
まず、セレンスとはどんな会社かと言えば、ニュアンス・コミュニケーションズのオートモーティブ事業部門が2019年10月に分離独立した企業で、セレンス・ジャパンはその日本法人となる。そして、ニュアンスは対話型AI技術のパイオニアだ。対話型AIとはアップルの「Siri」やアマゾンの「アレクサ」などを指す。最近では、自動車業界でもメルセデスベンツやBMWが対話型AI技術を量販車に採用しているが、そうした技術もニュアンス・コミュニケーションズのものが使われている。
また、こうした対話型AI技術は、他ブランドにも広がることが予想され、それには新しくセレンスが大きく貢献することになるのは間違いないはず。クルマ好きであれば、ぜひとも「セレンス」という社名を覚えておくといいだろう。
そのセレンスによる次世代技術というのが「セレンス・マルチモーダルPOC」だ。これは複数の入力によって、人とクルマのコミュニケーションを実現させようというもので、具体的に言えば「音声」と「視線」。従来の対話型AI技術は、「音声」というひとつのインターフェースで、クルマ(システム)と人(ドライバー)のコミュニケーションをとっていた。これにドライバーの「視線」を加えたのが「セレンス・マルチモーダルPOC」だ。
このアイデア自体は、2019年1月のラスベガスで開催された「CES 2019」で発表されていた。運転席の前に赤外線カメラが設置され、ドライバーの視線の動きを検知。そのカメラからの情報と音声情報を組み合わせて新しいサービスを行なう。ドライバーが助手席の方を見て、「窓を開けて」と発話すれば、助手席側の窓が開く。「××さんに電話」と発話すると、フロントウインドウに「××さん」の複数の電話番号の候補が表示され、ドライバーが視線で選択できる。CES 2019では、そのようなアイデアがいくつか提案されていたのだ。
そうした数あるアイデアの中で、今回の東京でのデモは“クルマの周りにある建物をドライバーが見ながら、「あそこにあるお店は何? 価格帯は?」と発話すると、クルマ側が情報を提供する”というものであった。
デモ走行は、東京のお台場エリアを15分ほど走るというもの。走行コースの周辺にある建物や店に対して、ドライバーが「あの店の営業時間は?」「あの建物は何?」「あの施設の電話番号を教えて?」と尋ねる。すると、クルマに搭載されたシステムが店の名前や営業時間、電話番号などを音声とモニターへの表示で答えた。
デモ開始前に一旦停止して、GPSで自車位置を確認。赤外線カメラでドライバーの視線を常時監視し、ドライバーが質問を発話した瞬間に、その時の視線の方向とマップデーターを照らし合わせて、対話型AIとして回答する。
デモ走行では、新交通の高架下というGPSの受信状況の悪いところでは、いまひとつ精度が悪いようであったが、開けた場所での動作は迅速で安定していた。じっと何かを凝視する必要はないので、安全面での問題は小さそうだ。しかし、こうしたサービスの実用化には、膨大な店舗データが必要となる。いくつかのハードルは存在するだろうが、新しく便利なサービスだということは間違いない。“夢の次世代技術”ではなく、なんとか実用化を期待したい。
筆者紹介:鈴木ケンイチ
1966年9月15日生まれ。茨城県出身。国学院大学卒。大学卒業後に一般誌/女性誌/PR誌/書籍を制作する編集プロダクションに勤務。28歳で独立。徐々に自動車関連のフィールドへ。2003年にJAF公式戦ワンメイクレース(マツダ・ロードスター・パーティレース)に参戦。新車紹介から人物取材、メカニカルなレポートまで幅広く対応。見えにくい、エンジニアリングやコンセプト、魅力などを“分かりやすく”“深く”説明することをモットーにする。
最近は新技術や環境関係に注目。年間3~4回の海外モーターショー取材を実施。毎月1回のSA/PAの食べ歩き取材を10年ほど継続中。日本自動車ジャーナリスト協会(AJAJ)会員 自動車技術会会員 環境社会検定試験(ECO検定)。