このページの本文へ

富士通SSLの「Live Talk」で講演のリアルタイム英語字幕サービスを提供

Tech Summit講演の英語字幕、日本語認識は国産ソフト「AmiVoice」を使用

2017年11月15日 12時00分更新

文● 羽野三千世/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 日本マイクロソフトが11月8日~9日に開催した開発者向けイベント「Microsoft Tech Summit 2017」では、講演の日本語音声をリアルタイム機械翻訳して英語字幕を表示していた。もちろん翻訳エンジンはマイクロソフト自慢の「Microsoft Translator」を使っているのだが、日本語音声認識の部分は国産のサードパーティー製だ。

Tech Summit 2017では各講演でリアルタイムの英訳字幕を流した

 イベントで使用したのは、富士通ソーシアルサイエンスラボラトリ(富士通SSL)が販売するリアルタイム自動翻訳システム「FUJITSU Software Live Talk」。発話者の発言を音声認識・多言語翻訳して、リアルタイムに字幕を配信する(今回のイベントでは字幕を壇上のスライドに表示していたが、字幕を遠隔地の複数端末に同時配信することも可能)。日本語、英語、中国語など全19言語間の音声認識・自動翻訳に対応している。

 Live Talkでは、多言語音声認識とテキスト化に「Microsoft Cognitive Services」の「Bing Speech API」、多言語翻訳には「Translator Text API」を使用している。ただし、日本語の音声認識については、アドバンスト・メディアの音声認識エンジン「AmiVoice」を採用している。リアルタイムに翻訳結果を返す仕組みは富士通SSLの独自技術ということだ。Tech Summitに合わせて技術用語や製品の固有名詞を辞書登録しており、講演ではかなり精度の高い英訳がなされていた。

 Bing Speech APIは日本語音声認識にも対応しているのだが、まだ国産ソフトに精度が及ばないようだ。Cognitive Serviceの音声認識機能や翻訳機能はOfficeアプリにも実装が進み、ビジネスユーザーが簡単に使えるテクノロジーになってきた。だからこそ、日本語認識の精度は特に頑張ってほしい。来年のTech SummitではMicrosoft Cognitive Servicesが華麗に日本語を扱う様を期待したい。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    ネットワーク

    「ケーブルを引っ張ってみてください。」→引っ張ってみた結果……

  2. 2位

    TECH

    Claude CodeのPlan modeをやめてみる ~grill-meスキルで一歩ずつ設計を固め、アプリを作る~

  3. 3位

    ネットワーク

    量子コンピューターを超える!? 「光量子コンピューター」ってのがあるんです。

  4. 4位

    ネットワーク

    「手のひらネットワーク機器」第4弾が登場、テーマは“ShowNetを手のひらに”! こだわりの両面マウントや高密度ポートも 6月11日発売

  5. 5位

    ネットワーク

    マザーボードが油に沈んでる!? SFみたいな“液浸冷却システム”、見た目からして未来すぎる

  6. 6位

    トピックス

    “スター・ウォーズのホログラム”が現実に近づいた? 幕張で見つけた裸眼3Dディスプレイが未来すぎる

  7. 7位

    ネットワーク

    データセンター不足の救世主になるか? “コンテナ型サーバー”が想像以上にすごい

  8. 8位

    ネットワーク

    キオクシアって結局なに作ってるの? 「株価急騰の注目企業」を幕張で見てきた

  9. 9位

    ネットワーク

    800名のエンジニアが作る無料Wi-Fiって何だ!? 会場限定ネットワークが本気すぎる

  10. 10位

    ITトピック

    AIによるソフト開発加速の裏で「未テストの本番投入」も増加/「AIで日常生活が変わった」まだ45%/企業のコンサルへの不満、ほか

集計期間:
2026年06月06日~2026年06月12日
  • 角川アスキー総合研究所