このページの本文へ

富士通SSLの「Live Talk」で講演のリアルタイム英語字幕サービスを提供

Tech Summit講演の英語字幕、日本語認識は国産ソフト「AmiVoice」を使用

2017年11月15日 12時00分更新

文● 羽野三千世/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 日本マイクロソフトが11月8日~9日に開催した開発者向けイベント「Microsoft Tech Summit 2017」では、講演の日本語音声をリアルタイム機械翻訳して英語字幕を表示していた。もちろん翻訳エンジンはマイクロソフト自慢の「Microsoft Translator」を使っているのだが、日本語音声認識の部分は国産のサードパーティー製だ。

Tech Summit 2017では各講演でリアルタイムの英訳字幕を流した

 イベントで使用したのは、富士通ソーシアルサイエンスラボラトリ(富士通SSL)が販売するリアルタイム自動翻訳システム「FUJITSU Software Live Talk」。発話者の発言を音声認識・多言語翻訳して、リアルタイムに字幕を配信する(今回のイベントでは字幕を壇上のスライドに表示していたが、字幕を遠隔地の複数端末に同時配信することも可能)。日本語、英語、中国語など全19言語間の音声認識・自動翻訳に対応している。

 Live Talkでは、多言語音声認識とテキスト化に「Microsoft Cognitive Services」の「Bing Speech API」、多言語翻訳には「Translator Text API」を使用している。ただし、日本語の音声認識については、アドバンスト・メディアの音声認識エンジン「AmiVoice」を採用している。リアルタイムに翻訳結果を返す仕組みは富士通SSLの独自技術ということだ。Tech Summitに合わせて技術用語や製品の固有名詞を辞書登録しており、講演ではかなり精度の高い英訳がなされていた。

 Bing Speech APIは日本語音声認識にも対応しているのだが、まだ国産ソフトに精度が及ばないようだ。Cognitive Serviceの音声認識機能や翻訳機能はOfficeアプリにも実装が進み、ビジネスユーザーが簡単に使えるテクノロジーになってきた。だからこそ、日本語認識の精度は特に頑張ってほしい。来年のTech SummitではMicrosoft Cognitive Servicesが華麗に日本語を扱う様を期待したい。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    トピックス

    “持たない家電”ランキング、もはや定番のアレがやっぱり1位なような

  2. 2位

    ビジネス・開発

    こんどは“市区町村の財政状況”が丸わかり デジタル庁「ジャパン・ダッシュボード」に地方財政データ追加

  3. 3位

    ITトピック

    管理職ほど機密情報をAIに入力している実態、なぜ?/27卒学生の就職人気、IT業界トップ企業は/最新インシデントの傾向10パターンまとめ、ほか

  4. 4位

    トピックス

    若い人ほど「しっかり睡眠」、中高年は眠れないのか眠らないのか

  5. 5位

    トピックス

    【無双状態】2025年、最も雑誌の表紙を飾ったのは「えなこ」! 1万誌を調査して見えた圧倒的カバークイーン

  6. 6位

    TECH

    技術ニュースを毎朝スマホで流し読みしたい、だから自分専用サイトを開発した話

  7. 7位

    トピックス

    ほぼスーパーで良くない? コンビニで「思ったより高い」と感じる人76%、実は中高年ほど割高感に悩んでるって知ってた?

  8. 8位

    トピックス

    その発想はなかったー! 「中古の船」を海上データセンターにする構想がすごいぞ!

  9. 9位

    トピックス

    【人材争奪戦】大手企業の8割超が「高度IT人材」採用に危機感! 今一番欲しいのは「AI」と「セキュリティ」のプロだぞ

  10. 10位

    トピックス

    「寝不足だから仕事休むね」世界は7割、日本では4割が経験

集計期間:
2026年04月24日~2026年04月30日
  • 角川アスキー総合研究所