Google VS Amazon:対話型AIの覇権を争う二大巨頭の研究開発戦略
国内の”知の最前線”から、変革の先の起こり得る未来を伝えるアスキーエキスパート。KDDI総合研究所の帆足啓一郎氏による人工知能についての最新動向をお届けします。
スマートスピーカーの登場により、人間と同じ言葉で会話ができる「対話型AI」がいよいよ本格的に普及しつつある。その最先端を突っ走っているのが、スマートスピーカーをそれぞれ発売しているAmazonとGoogleである。圧倒的なリソースと技術力を武器に革新的な研究を推し進め、次々と発表しているGoogleに対し、Amazonの対話型AIにおける新しい機能の強化は比較的地味なものにみえる。しかし、その実態を分析すると、同社のしたたかな戦略が垣間見える。
本記事では、最先端の自社技術によって対話型AIの多機能化を図るGoogleに対し、Amazonがとっているオープン戦略に着目し、両社の対話型AIの今後について読み解く。
Google I/Oの対話型AIデモの衝撃
本年5月に開催された「Google I/O 2018」では、Googleが手がけるさまざまなAI関連の研究開発成果が披露された。このイベントの中で発表された多数の成果の中で、最も話題になったものの1つが「Google Duplex」のデモである。
Google Duplexは、ユーザーに成り代わって電話をかけ、通話相手の人間との交渉を含む高度な対話ができる、Google Assistantの新機能である。
Google I/Oのキーノート講演の中で紹介されたGoogle Duplexの対話は、普通の人間のような音声で話すだけでなく、電話の相手の反応に合わせて相槌を打つなど、人間同士の会話と言われてもわからないほど自然なものであった。
YouTubeに公開されているGoogle I/O 2018キーノート講演動画の35分過ぎあたりからデモが紹介されているので、ぜひご覧いただきたい。
このような画期的な技術の礎になっているのは、Googleがさまざまな手段で集めた巨大なリソースにある。対話型AIを構成する要素技術である音声認識や音声合成では、Deepmind社のディープラーニング技術を、自社のウェブ検索サービスによって蓄積された膨大な自然言語データに適用することにより、世界最高レベルの性能を達成している。
また、ユーザーの発話に対する音声認識の結果を受け取り、対話型AIの次の発話を決定するために必要な「対話制御」の技術に関しても、先進的な対話システムを開発していたAPI.AI社を買収(現在はDialogFlowと改名)するなどして、高度化を推し進めている。
このように、Googleでは対話型AI関連の研究を進めるために必要なリソースである計算能力、膨大なデータ、そして優秀な人材をどんどん自社に取り込み、新しい技術を続々と作る原動力にさせている。完成された技術は、自社のスマホ向けアプリであるGoogle Assistantや、自社製スマートスピーカーのGoogle Homeの中の新機能として華々しくローンチされる。
Googleに対抗するAmazonの研究開発戦略
圧倒的な自社リソースを元に革新的な技術を続々と発表しているGoogleに対し、スマートスピーカー販売で先行していたAmazonの動向は地味に見える。Amazon Echoがリリースされた2014年当時は、その新しい世界観がイノベーター層を中心に称賛を受けるなど、大きな反響を得た。その後、CES 2017では自動車メーカーや家電メーカーなど、多数の企業がAmazonのAI技術「Alexa」の搭載を発表。Amazon自身は出展していなかったにもかかわらず、同イベントを席巻する存在感を示していた。
その後も、Amazon Echoの出荷台数は順調に伸びており、ディスプレーを搭載したAmazon Echo Spotやビデオカメラを搭載したEcho Lookなど、新たな付加機能を備えた新型モデルも発表されている。しかし、スマートスピーカーの対話の中身については、発売当初から比較すると、Googleほどの派手な進化は遂げていないようにみえる。
その影響もあってか、米国の調査機関・Consumer Intelligence Research Partners(CIRP)の調査によれば、それまでAmazon Echoがほぼ独占していたスマートスピーカーの市場に対し、Googleのシェアが昨年後半以降、急速に伸びている(図2参照)。
上記の情報を見ると、対話型AIの領域においては、Googleの攻勢を受けて、Amazonの勢いが衰えているようにみえる。しかし、対話型AIの研究開発においてAmazonは手をこまねいているわけではない。むしろ、Googleとは異なるオープンイノベーション戦略を積極的に推進することにより、独自の方法で対話型AIの機能を発展させているのである。
たとえば、Amazon Echo上では、開発者が「スキル」と呼ばれる独自の対話型AIを開発し、Amazon Echoのユーザに広く使ってもらえる場が提供されている。現在、Amazon Echoで利用できるスキルの一覧を見ると、非常に多くのスキルが公開されている。これらのスキルの中には、JR東日本やローソンなどといった大企業が開発しているものが多い。
Google Homeでも、独自のアプリ(対話型AI)を開発する環境は提供されている。しかし、本記事を執筆している時点で公開されているGoogle Home向けのアプリは、個人の開発者が作成したと思われるものがほとんどであり、Amazon Echoと比較すると、ネームバリューのある企業が提供している実用性の高いアプリは少ない。
さらに、対話型AIの研究開発においても、Amazonのオープン志向は顕著である。
Amazonが2017年から開催している「Alexa Prize」は、無目的の雑談を続けられる対話型AIの実現を目的としたコンテストである。グランドチャレンジとして、人間との雑談を20分以上続けられる対話型AIの実現を掲げており、最終審査の結果、このミッションに成功したチームには賞金100万ドルが授与される。参加チームには、Amazonが有する言語解析モジュール、対話のネタとして活用できるコンテンツ(Amazon傘下のWashington Postの新聞記事など)、そしてAmazon Cloud上の開発環境が提供されている。
さらに、一次評価では、各チームによって開発された対話型AIを一般のAmazon Echoユーザに開放し、その利用実態に基づいた評価が行なわれる。参加チームにとっては、単に研究として対話型AIを試作するだけでなく、多数のユーザーにトライアルしてもらえる貴重な場となっている。
また、Amazon Voice Service(AVS)という開発者向けサービスでは、開発者がAlexa搭載デバイスのプロトタイプを制作するための環境が提供されている。このAVSでは、APIなどを活用した対話型AIのソフトウェア開発キット(SDK)は無論のこと、ハードウェアを作るためのデバイス開発キットも提供されているのが特徴的である。
ハードウェア開発キットのデバイスとRaspberry Piなどをつなぎ、SDKで開発したソフトウェアを実装することで、Amazon Alexaの機能を搭載した独自デバイスの試作が可能となる。こうした試みを通じ、自社製のスマートスピーカー以外にもAmazonの対話型AIの世界を広げ、対話型AIが使える空間の拡大を図っている。
以上の動向を鑑みると、自社のリソースの強化によって対話型AIの機能を発展させているGoogleに対し、社外のリソースを活用して対話型AIの世界を広げようとしているAmazonという、顕著な戦略の違いが見える。
では、Amazonがここまでオープンな形で研究開発を推し進める狙いはどこにあるのだろうか?
Amazonのオープン戦略の狙い
Amazonが対話型AIに取り組む理由としてまず思い浮かぶのは、Amazonのコア事業であるeコマースへのアクセスの拡大だろう。Amazon EchoのテレビCMでも、音声を使って商品を注文する様子が描かれるなど、声だけで買い物ができるという利用場面はAmazon Echoの発売当初から打ち出されており、同社が対話型AIを開発している目的の1つであることは間違いない。
しかし、前述したサードパーティー製のスキルのほとんどは、Amazonのeコマースとの直接の関連性はない。したがって、オープン戦略をとっている理由としては説明しにくい。
筆者の個人的な意見になるが、Amazonが対話型AIのオープン化を推し進めるいくつかの理由の中には、以下の2つがあると考えている。
1.データ独占への批判の回避
1つ目の狙いは、対話型AIを多数の企業に利用してもらうことで、ユーザーに関するデータの一極集中への社会的な批判を回避することである。
昨今、Facebookが蓄積している個人データが政治目的で悪用された事件が大きな社会問題になるなど、個人に関する膨大な情報の一極集中に対する懸念が広まっている。EUにおけるGDPR(EU一般データ保護規則)の施行は、大企業へのデータの一極集中を回避し、個人に関するデータの権利を保護することを意図した政治的な動きである。そして、個人データを独占的に集め、その収益の源としている米国の巨大IT企業はこの規制の主たるターゲットになっている。
Googleが提供しているGoogle HomeやGoogle Assistantなどの対話型AIとユーザーとのやりとりは、当然ながらGoogleが集めている。これらの対話型AIが提供する機能が多岐にわたればわたるほど、多様な情報がGoogleに集約されることとなる。つまり、Googleが開発している対話型AIの多機能化は、同社へのデータ集中のさらなる加速を生む。その結果、GDPRのような規制のターゲットとしての注目をますます浴びる可能性がある。
データを集めるという点においては、AmazonもGoogleと同様の性質を持つ。しかし、対話型AIに関していうと、個々のAmazon Echoで動作するスキルの利用履歴などの情報は、各スキルを運営している企業の管理下にある。Amazonは外部の企業が活用できるオープンなプラットフォームを提供することにより、自社以外のプラットフォームユーザーにとってのメリットを創出しており、自社中心のGoogleのスタンスと大きく異なる。
そのため、対話を介したデータ収集という観点においては、GoogleやFacebookと比較すると「一社独占」という印象は薄く感じられる。
2.対話型AIのプラットフォーム事業化
2つ目の仮説は、対話型AIのプラットフォーム事業化である。
以前、本連載の記事(「食われる前に自ら食え」米国最大級AIイベントで聞いたAI時代の脅威への有効策)でも紹介した通り、米国では対話型AIに対する期待は高い。より具体的には、顧客からの問い合わせ対応のみならず、顧客とのタッチポイントとしての対話型AIの活用が米国ビジネス界では有望視されている。
現時点では、対話型AIを構成するための要素技術である自然言語解析のレベルがまだ十分ではないため、特定のシナリオに限定されたシンプルな対話しか実現できていない。しかし、いずれ複雑な対話にも対応可能な技術ができたら、対話型AIは企業と顧客とのエンゲージメントを作るために不可欠なチャンネルに発展する可能性がある。
そうなった場合、現時点ですでに多くの企業の対話型AIが稼働しているAmazonのプラットフォームが、各企業の対話型AIを構築する場として優位な立場に立てる可能性は高い。実際、対話型AIの開発者向けには、Alexaを使った対話型AIの基本的な開発機能だけでなく、サンプルコードやオンラインのチュートリアルなどの情報も豊富に提供されている。これらの情報を参照することで、シンプルな対話型AIであれば比較的容易に試作できる。
一方、前述の「Alexa Prize」では、少し高度な機能や言語リソースも参加者向けに公開されており、コンテストに参加しているチームの雑談対話型AIを実現する助けとなっている。2017年のAlexa Prizeで最優秀賞を受賞したUniversity of Washingtonの研究チームは、(Alexa Prizeに投稿されている論文によれば)コンテストに参加する前は対話型AIの開発経験がなかったにも関わらず、Amazonから提供されたコンポーネントを活用するなどして、短期間で平均10分以上の雑談にも耐えられる対話型AIの開発に成功している。これは、Amazonが参加者向けに提供している機能や言語リソースによるところが大きい。
Alexa Prizeへの参加を通じて得られた研究開発成果の商用化については、Amazonからは特に制約は設けられていない。しかし、Amazonが提供している機能やリソースを活用している以上、ほかのプラットフォームへの移行コストは小さくなく、結果的にAmazonのプラットフォーム上に最適化された対話型AIが複数できることとなる。
このように、Amazonがプラットフォームを広く公開することにより、多数の対話型AIの開発者による技術的なノウハウを集めることができる上、対話型AIの開発者をプラットフォームに(ゆるやかに)縛りつけることができる。そして、これらの開発の成果として世に出される対話型AIを利用するユーザーのデータも蓄積される。
これらの情報を深く分析したり、開発者の声を聞いたりすることによって、より多くのニーズに応えられる技術を見出すこともできる。汎用性が高く、かつニーズが強い課題が見つかれば、それを新たな技術として自ら実装し、プラットフォームの拡張機能として提供できる。
この改善のプロセスを繰り返すことにより、開発者のニーズに合わせる形でプラットフォーム自体の優位性を高めることができる。
このプラットフォーム戦略については、Amazonにはすでに大成功をおさめている先行事例がある。それこそが、Amazon Web Service(AWS)である。
AWSの開始当初は、ウェブクラウドサービスの基本機能である仮想サーバー(現在のAmazon EC2)とデータストレージ(現在のAmazon S3)の2つの機能のみが提供されていた。これらのコア機能を、当時の既存サービスとは比べものにならないほどの安価で提供することにより、瞬く間に多くのユーザーを集めた。
さらに、利用状況を分析したり、意見を集めたりしながら潜在的なニーズを発掘し、主要ニーズについては対応する新たな機能としてリリースする。このユーザー中心の研究開発のループを回すことにより、AWSの利便性は日々高められ、さらに多くの顧客を集める原動力となる。
今やAWSはあらゆるITサービスにおいて利用される基盤としての絶対的な地位を確立しており、Amazonのコア事業であるeコマースよりも高い営業利益を出す優良事業に成長しているのは周知の通りである。
現時点では、まだ対話型AIそのものが本格的な基盤ビジネスにまで成長するかは未知数である。しかし、ここまでのオープン戦略を見ていると、AmazonがAWSに続く2匹目のドジョウを目指して、プラットフォームとしての対話型AIを発展させている可能性は高い。
技術志向のGoogle VS 戦略志向のAmazon、そして追随するLINE?
上記の通り、対話型AIに着目して、GoogleとAmazonの研究開発戦略を分析することにより、この両社がとっている対照的なアプローチが見てとれる。
圧倒的なリソースの吸引力により、高度な技術をどんどん取り込み、自社サービスの多機能化を進める超・技術志向のGoogleに対し、オープン戦略によって対話型AIのユーザーと利用場面を着実に広げ、プラットフォームを幅広く展開する戦略志向のAmazon。筆者は、研究者という仕事柄、これまではGoogleの革新的な研究開発に注目することが多かったが、今回の分析を通じて、ビジネス観点でのAmazonのオープン戦略のしたたかさに改めて気づかされた。
こうした動きに呼応するような形で、対話型AIにおいてはチャレンジャー的ポジションにいるLINEが、LINE Clovaの対話プラットフォームのオープン化を発表している(2018年6月28日付、LINE株式会社プレスリリース参照)。リリースでは、初期パートナーとして34社の企業が名を連ねていることや、賞金1000万円の開発コンテスト「LINE BOOT AWARDS」開催が発表された。
これらの施策は、Amazonのものと極めて類似しており、同社の戦略を志向しているようにみえる。国内では有数のユーザー数を誇るLINEがこれから対話型AIビジネスにどう切り込んでいくのか、注目である。
かつてのITビジネスにおいては、より多くのデータを集めることにより優位性・収益性を高める「データ主義」が有効とされていた。GoogleとAmazonはこのビジネス領域においては圧倒的な勝者といえる。しかし、昨今の政治や社会的な変動と相まって、単純に膨大なデータを集めてマネタイズするビジネスモデルにも変革が求められている。
現時点での勝者であるGoogle、Amazonなどの巨大IT企業が次の世界をどのようにリードしていくのか、あるいはLINEなどの追随により、まったく新しい戦い方が生まれてくるのか。対話型AIの技術の進化と併せて、各社のビジネス戦略からも目が離せない状況である。
謝辞
本記事は、筆者が通っている東京理科大学・MOTの講義の一環として行なわれたグループ討議の内容をまとめて執筆したものである。この議論に対し多大な貢献をいただいたグループメンバーのみなさま、そしてご指導いただいた東京理科大学の若林秀樹教授に深謝する。
アスキーエキスパート筆者紹介─帆足啓一郎(ほあしけいいちろう)
1997年早稲田大学大学院修了。同年国際電信電話株式会社(現KDDI株式会社)入社。以来、音楽・画像・動画などマルチメディアコンテンツ検索の研究に従事。2011年、KDDI研究所のシリコンバレー拠点を立ち上げるため渡米し、現地スタートアップとの協業を推進。現在は株式会社KDDI総合研究所・知能メディアグループ・グループリーダーとして、自然言語解析技術を中心とした研究開発を進めるとともに、研究シーズを活用した新規事業創出に取り組んでいる。電子情報通信学会、情報処理学会、ACM各会員。経済産業省「始動Next Innovator 2015」選抜メンバー。