このページの本文へ

方言も訳す謎にせまる、日本MS榊原CTOと技術統括田丸氏が解説

翻訳AIはどうやって言葉を学ぶの?「Microsoft Translator」開発秘話

2017年11月15日 12時30分更新

文● 阿久津良和 編集 ● 羽野/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 日本マイクロソフトが11月8日~9日に開催した開発者向けイベント「Microsoft Tech Summit 2017」では、インフラエンジニアやアーキテクトなど、多くのユーザーを対象にした多数のセッションが開かれた。本稿では「Microsoft Translator開発秘話」と題した、日本マイクロソフト 執行役員 最高技術責任者 榊原彰氏と、同社業務執行役員 技術統括室 ナショナル テクノロジー オフィサー 田丸健三郎氏のセッションを紹介する。

日本マイクロソフト 執行役員 最高技術責任者 榊原彰氏

MSが2003年から開発してきた機械翻訳の技術

 4月に日本語の音声翻訳にも対応したマイクロソフトの機械翻訳エンジン「Microsoft Translator」。同社が機械翻訳技術の開発に取り組み始めたのは2003年までさかのぼる。

 1992年から日本マイクロソフトに在籍する田丸氏は、2003年当時を振り返り、「当初はルールベースの機械翻訳を使っていたが、その後は統計的機械翻訳(SMT)が普及し、弊社もSMTを利用してきた。大きく変わったのは、2012年11月にRichard Rashid氏(当時はMicrosoft Chief Research Officer)が中国で行ったデモンストレーション(英語で話した内容をテキスト化し、その内容を中国語に機械翻訳してからスピーカーを通じて話していた)。ここからサービス化の展開が始まり、2014年5月に『Skype Translator』としてローンチした」(田丸氏)とこれまでの流れを解説した。

 その後、2015年には深層学習を用いたニューラル機械翻訳(NMT)を採用。今ではSkype Translatorなど、多くのマイクロソフト製品にTranslator Text APIが導入されている。講演では、GitHub上で公開している「Microsoft Speech Translator」や、最大100人が参加して10言語の音声と60言語のテキスト翻訳を行う「Microsoft Translator」を、デモを交えて紹介した。

機械翻訳に関するの主なトピック。取り組み自体は2003年から行われていた

 榊原氏は、「音声翻訳品質はこの半年で大幅に向上している。ビジネスシーンでも利用可能になりつつあり、テキストと音声の両方を動的に翻訳して円滑なコミュニケーションを実現する弊社のビジョンを実現した1例」と述べた。その一方で、機械翻訳の性能評価は難しいと説明する。「機械翻訳の核となるアルゴリズムだけではなく、学習に用いるデータセットが品質に影響を与えるからだ」(田丸氏)。

 マイクロソフトは検索エンジンなどを用いてインターネットから各種データを収集しているが、場合によってはスポーツやヘルスケアといった特定分野に対するデータセットが必要になるケースがある。例えば法律用語と医療用語の表現が大きく異なるように、機械翻訳の世界ではどの領域に合わせてチューニングすべきか、対象領域を特定するかなど、シチュエーションによって揺らぎが発生してしまうという。

翻訳品質を高める工夫

 マイクロソフトでは、特定のデータセットを学習・展開させることで任意の分野に特化した機械翻訳を実現する「Microsoft Translator Hub」を提供し、機械翻訳で最も広く用いられているBLEU(BiLingual Evaluation Understudy)スコアを併用しつつ、「Microsoft TrueText」を用いたチューニングを行っている。

 「例えば『橋を渡る』と『箸を落とす』の2つの文章。『はし』という単語1つ取っても前後の文脈が影響を及ぼすが、(無意味な音や)反復を除去するTrueTextで機械翻訳の品質を向上させている」(田丸氏)という。「人間の翻訳品質は約80%、通常の機械翻訳は30~40%。チューニングすると40~60%まで向上する」と田丸氏。

日本マイクロソフト 業務執行役員 技術統括室 ナショナル テクノロジー オフィサー 田丸健三郎氏

 この他にも、文脈に重み付けをする分析技術を用いて適切な翻訳結果を導き出すような工夫や、豊橋技術科学大学と連携して対訳データベースの構築やデータ収集に取り組むなど、多角的に機械学習の品質向上に努めている。それでも、「NMTだけが優れている訳ではない。文脈がそろっている(文章などの)場合はNMTが有効だが、単語ベースの翻訳は辞書ベースやSMTが有効。翻訳対象に応じて翻訳エンジンを選ぶとよい」と田丸氏はアドバイスした。

有償プランはビジネスの機密データの翻訳にも使える

 マイクロソフトのTranslator Text APIは200万文字まで無償だが、それ以上は4段階の従量課金制となっている。「有償には意味があり、上位プラン(S2~S4)には翻訳データをすべて削除する『No-Trace option』を提供している。また、コンフィデンシャルなデータを翻訳したいという需要にはオンプレミス版の機械翻訳サービスを用意している」と田丸氏は説明した。

「Microsoft Translator」は地方の方言にも一部対応している

 今回のセッションで興味深かったのは、榊原氏の友人がSNSに投稿した方言の翻訳結果だ。スマートフォン用の「Microsoft Translator」に福島県只見町の方言を入力したところ、正しく英文に翻訳できたという。この点について、「方言データは入れていないが、方言を説明したWebサイトがあり、そこからデータを収集していたのでは」(田丸氏)とのこと。

■関連サイト

カテゴリートップへ

ASCII.jp特設サイト

クラウド連載/すっきりわかった仮想化技術

ピックアップ