このページの本文へ

音声インターフェイスがOMOの中核へ、CESで見えた新潮流

2019年01月15日 10時49分更新

文● Karen Hao

  • この記事をはてなブックマークに追加
  • 本文印刷

将来、あらゆる所有物は、声でコントロールできるようになる。1月8~11日にラスベガスで開催された電子機器の世界最大の年次イベント「コンシューマー・エレクトロニクス・ショー(CES 2019)」では、そうしたビジョンが極めて明確となった。

グーグルとアマゾンは、自社の音声アシスタントを、テレビやクルマ、さらには浴室にさえ設置させようと熾烈な戦いを繰り広げている。CES開催期間中のラスベガスの新聞の見出しを飾った、音声コントロール製品のラインナップは、各社の野心のほどを見せつけていた。

いまやアレクサ(Alexa)にトイレのカバーを開けさせられることは、資本主義の生み出すまったく無駄な副作用のようにも思われる(人によっては無駄なことではないかもしれない)。しかし、音声インターフェイスの普遍化には、時流に乗らんとするハードウェア企業の飽くなき取り組み以上の大きな意味がある。

音声コントロールは、AI(人工知能)の専門家であるカイフ・リー(Kai-Fu Lee、李開復)が、「オンライン・マージ・オブ・オフライン(OMO、オンラインとオフラインの融合)」と呼ぶアイデアと結びつく。リーの説明によれば、OMOは我々を取り巻く環境の中のあらゆる物体が、インターネットや我々の生活に関するデータを集めるセンサーと相互に作用する接点となり、デジタルの世界と物理的な世界が結びつくことを意味する。OMOは、リーが言うところのAIの「第三の波」の推進力となる。つまり、アルゴリズムは我々のあらゆる行為に関する包括的なデータを与えられることで、高度に個別化された体験を提供できるようになる。そこが食料品店であろうと、教室であろうとだ。

ただし、このビジョンを実現するには、すべてがつながっている必要がある。買い物カートが最適な買い物リストを進言するには、買い物客の家の冷蔵庫の中に何があるかを知っていなければならない。玄関のドアは、そこに住んでいる人がオンラインで何を買ったか、そしてそれが家の中に運び込まれることになっているかどうかを把握している必要がある。そこで、音声インターフェイスの登場である。冷蔵庫やドアやその他のさまざまな所有物にアレクサを設置することで、それらが整然と1つのソフトウェアのエコシステムにつながるのだ。なかなか賢いやり方だ。パワフルでシームレスな便宜を図ってくれる音声アシスタントを売ることで、グーグルやアマゾンは徐々に、人々のすべてのデータの中心となるプラットフォームとなり、日常生活をアルゴリズムによって効率化する中核的なエンジンとなるわけだ。

消費者がこれほど大きな力を持つ企業を信頼しようとしまいと、巨大テック企業の壮大な企てがうまく行くかは音声アシスタントが何を理解できるかにかかっている。AIの他の分野と比較すると、自然言語処理における進歩は、若干の後れをとっているのだ。

しかし、そうした状況も変わろうとしている。2018年に、いくつかの研究チームが、新たな機械学習手法を使って、言語理解に関して大きな突破口を開いた。たとえば6月には非営利団体のオープンAI(OpenAI)が、整理やラベル付けなどによる構造化がされていないテキストを用いてシステムを訓練できる教師なし学習の技法を開発した。この手法により、大量の訓練用データを入手するためのコストを大幅に低減し、結果として、システムの処理能力を高め流ことができた。その数カ月後には、グーグルがさらに性能の高い教師なしアルゴリズムを発表した。多肢選択式の解答の付いた文章を、人間とほぼ同等に完成させられるアルゴリズムである。

こうした進歩によって、機械が我々の言わんとするところを本当に理解し、大きな可能性を秘めたOMOの世界が到来する日が、善かれ悪しかれ、近づきつつある。物理的・視覚的なインターフェイスは時代遅れだとみなされる日がくるかもしれない。

カテゴリートップへ

アスキー・ビジネスセレクション

ASCII.jp ビジネスヘッドライン

ピックアップ