すぐに会話が成立しなくなってしまうチャットボットをもっと賢くする方法が編み出された。事前に第2言語を学ばせることで効率よくチャットボットを訓練できるという。
アレクサ(Alexa)、シリ(Siri)をはじめとする無数のチャットボットから、カスタマー・サポートの自動応答に至るまで、コンピューターは徐々に会話を覚えつつある。唯一の問題は、まだまだ簡単に支離滅裂になってしまうということだ。
セールスフォースの研究チームが、多くの現代語プログラムの性能を向上できる妙手を考案した。特定の作業をするためにアルゴリズムを訓練する前に、他言語を教えておくという手法である。
機械に筋の通った会話をさせることは、依然として人工知能(AI)に立ちはだかる課題とされている。なぜなら、会話や記述された文章の意味を紐解くには、大抵の場合、世間一般に対する幅広い理解力や常識的な知識が必要だからだ(「人工知能と言語」参照)。
つまり、二言語間の翻訳をするように機械学習システムを訓練すれば、自然な成り行きとして、単語の関係性や文脈上の適切な意味合いを処理するのに役立つ事柄を学習できる、ということだ。二言語を習得したシステムを別の機械学習システム、たとえば、会話や文章に込められた感情を読み取るシステムの基礎として訓練すれば、ゼロから訓練するシステムよりも遥かに優れた性能を発揮する。
「私たちは機械翻訳のデータを利用しています。システムに教えている内容は、要するに、単語と文脈をどのように理解するかということです」と、機械学習と言語の応用を専門とするセールスフォースのリチャード・ソーチャー主任科学者は話す。
この取り組みは、機械学習の進歩がどのようにAIシステムの言語能力向上に役立つかを示す1つの例だ。深層学習を用いた多くのコンピューター・ビジョン・システムは、 何らかの形でニューラル・ネットワークの事前訓練をしている。これと似通った方法で、機械翻訳は自然言語システムの性能を高められるかもしれないと、ソーチャー主任科学者は示唆する。
セールスフォースは事業者向けのオンラインサービスだ。自社のプラットホーム「アインシュタイン」では、さまざまな人工知能ツールを提供している。Eメールやチャットメッセージに込められた心情を自動的に分類するツールや、利用者の過去の行動から興味のあるニュースを判断し、読むべき見出しに優先順位を付けるツールなどだ。
ソーチャー主任科学者は、今回の発見がプラットホーム、アインシュタインの自然言語処理能力の向上に役立つと考えている。「チャットボットや自動カスタマー・サポートにとって、非常に使い勝手がいい手法です」とソーチャー主任科学者は語る。
セールスフォースの研究チームは、深層学習システムに英独翻訳の訓練をした。この訓練では、多層ニューラル・ネットワークに膨大な数の訳文を読み込ませ、システムが学習して自力で正しい翻訳を出力できるようになるまで、ネットワークの設定値を微調整した。ニューラルネットでは単語はベクトルを使って表される。これは文章の意味をコード化し、構文を解析するために用いられる一般的な手法だ。
それから、研究者はバイリンガルとなったニューラル・ネットワークに現代語プログラムの訓練して、短い文章に示されている心情を判定したり、多様な質問を種類ごとに分類したり、質問に回答したりといった、さまざまな作業に当たらせた。その結果、事前に第2言語を学ばせたネットワークの性能が、第2言語学習をしなかったネットワークを上回ることがわかった。
機械翻訳のデータ・セットは特に量が豊富であり、その膨大さが機械学習が抱える課題解決に有利に働く。「翻訳とその他の言語との間には重要な結びつきが存在します」セールスフォースでこのプロジェクトに携わるブライアン・マッキャン研究員は語る。「翻訳のデータ・セットは、非常に一般的です。そこに含まれている情報は、自然言語処理という分野全体に役立つのです」。