機械翻訳の精度を高め、日本からの情報発信や訪日観光客へのサービス向上を――。豊橋技術科学大学(豊橋技科大)、日本マイクロソフト(日本MS)、ブロードバンドタワー(BBT)の三者が6月21日、「AI/機械学習による多言語コミュニケーション」の実現に向けた協働開始を発表した。最初の取り組みとして、訪日旅行客に対するリアルタイム翻訳などのサービスを可能にするプラットフォームの研究開発を進める。
三者はそれぞれの持つテクノロジーやノウハウを持ち寄り、機械翻訳のベースとなるAI/機械学習の品質向上に必要な情報収集やビッグデータの構築を協働で推進していく。
具体的には、豊橋技科大はデータ収集時における分野(ドメイン)ごとの重要語句抽出や分類、さらに匿名化/非識別化などによるサービス利用者からの安全なプライベートデータ提供のフレームワーク構築を行う。日本MSは、ビッグデータ蓄積と機械学習処理、機械翻訳エンジンなどの基盤として「Microsoft Azure」クラウドを提供する。BBTは新会社エーアイスクエアを設立し、高精度の機械翻訳を活用した企業向けサービス開発(Webサイト自動翻訳、コールセンターなど)とビジネス展開を行う。
なお、マイクロソフトはすでに、50の言語に対応した機械翻訳エンジン「Microsoft Translator」をはじめとして、音声認識や言語認識、言語分析などのAPI群を「Microsoft Cognitive Services」として提供している。今回の取り組みにおいてもこれは活用される予定だが、収集したデータ(対訳コーパスなど)は共同の知財となるため、これが直接マイクロソフトのサービスにフィードバックされるわけではない。日本MS CTOの榊原氏は、「今回のプロジェクトで得られた知見は(間接的に)将来の発展に役立てたいと考えている」と述べた。
将来的には三者だけでなく、プロジェクト参加企業/組織をさらに拡大していく方針。豊橋技科大の原邦彦氏は「プロジェクトがある程度進み、骨格が定まってくれば参加の枠組みも拡大していける」と述べた。またBBTの藤原洋氏は、「できるだけ仲間は増やしたいが、どうすればうまくいくかは、まず三者でやってみてからだ」としている。
「分野」を絞り込むことで、実用的な精度の機械翻訳を早期に実現する
豊橋技科大の原氏は、欧米言語間ではすでに機械翻訳(自動翻訳)の精度はすでに実用レベルとなっている一方で、日本語と他国語間の機械翻訳精度はそれには達していないことを指摘した。これは日本語の言語構造(たとえば主語を省略できる、欧米言語と語順が異なる、など)に起因する部分が大きく、単純に対訳コーパスを蓄積しても改善の難しい問題だ。
そこで今回の取り組みではまず、翻訳文の「ドメイン(分野)」を観光、医療、ITなど幾つかに絞り込み、それぞれに最適化された機械翻訳エンジン/コーパスを利用することで、翻訳精度を高める方針が採られる。
「各ドメインで“きちんとした言葉”を集めてくることが重要。現在、観光協会や旅行業者の協力が得られるようにアプローチしている」(日本MS 榊原氏)/「現在、宮崎県と具体的な話し合いを進めており、すでに利用できるデータをいただいている」(豊橋技科大 井佐原均氏)
またBBT 藤原氏は、ドメインを絞り込むことで、早期に実用化が可能になるという考えを示した。「すでに(言語解析などの)要素技術はできており、ドメインを絞っているので、約1年くらいで実用化に向けた目鼻は付いてくると考えている」(藤原氏)。