このページの本文へ

富士通SSLの「Live Talk」で講演のリアルタイム英語字幕サービスを提供

Tech Summit講演の英語字幕、日本語認識は国産ソフト「AmiVoice」を使用

2017年11月15日 12時00分更新

文● 羽野三千世/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 日本マイクロソフトが11月8日~9日に開催した開発者向けイベント「Microsoft Tech Summit 2017」では、講演の日本語音声をリアルタイム機械翻訳して英語字幕を表示していた。もちろん翻訳エンジンはマイクロソフト自慢の「Microsoft Translator」を使っているのだが、日本語音声認識の部分は国産のサードパーティー製だ。

Tech Summit 2017では各講演でリアルタイムの英訳字幕を流した

 イベントで使用したのは、富士通ソーシアルサイエンスラボラトリ(富士通SSL)が販売するリアルタイム自動翻訳システム「FUJITSU Software Live Talk」。発話者の発言を音声認識・多言語翻訳して、リアルタイムに字幕を配信する(今回のイベントでは字幕を壇上のスライドに表示していたが、字幕を遠隔地の複数端末に同時配信することも可能)。日本語、英語、中国語など全19言語間の音声認識・自動翻訳に対応している。

 Live Talkでは、多言語音声認識とテキスト化に「Microsoft Cognitive Services」の「Bing Speech API」、多言語翻訳には「Translator Text API」を使用している。ただし、日本語の音声認識については、アドバンスト・メディアの音声認識エンジン「AmiVoice」を採用している。リアルタイムに翻訳結果を返す仕組みは富士通SSLの独自技術ということだ。Tech Summitに合わせて技術用語や製品の固有名詞を辞書登録しており、講演ではかなり精度の高い英訳がなされていた。

 Bing Speech APIは日本語音声認識にも対応しているのだが、まだ国産ソフトに精度が及ばないようだ。Cognitive Serviceの音声認識機能や翻訳機能はOfficeアプリにも実装が進み、ビジネスユーザーが簡単に使えるテクノロジーになってきた。だからこそ、日本語認識の精度は特に頑張ってほしい。来年のTech SummitではMicrosoft Cognitive Servicesが華麗に日本語を扱う様を期待したい。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    TECH

    フォーティネットの「SSL-VPN廃止」 IPsec移行と脱VPN、それぞれの注意点を総ざらい

  2. 2位

    ビジネス・開発

    いますぐ捨てたいITサービスは? AI推しにそろそろ飽きてません? 情シスさんのホンネを「ゆるっとナイト」で聞いた

  3. 3位

    sponsored

    完全自動運転の実現へ、チューリングが開発基盤にGMO GPUクラウドを選んだ理由

  4. 4位

    ITトピック

    「AI導入で人員を減らしても収益は増えない」その理由/「専任情シス不在」中小企業の3社に2社/ユーザーアカウント流出が加速、ほか

  5. 5位

    ソフトウェア・仮想化

    「SaaSの死」の影響は感じない ― グローバル以上に好調な日本市場、ServiceNow鈴木社長が語る

  6. 6位

    Team Leaders

    Power AutomateでSharePoint APIを使う ― SPOリストを自動作成するフローを作ろう

  7. 7位

    TECH

    「蟻の一穴」となるリモートアクセスVPNの脆弱性 ZTNA/SASEはなぜ必要か?

  8. 8位

    エンタープライズ

    基盤も古いし、コードも酷い! そんなクエストにGitHub Copilotで試行錯誤しまくった「みんな」こそ最高

  9. 9位

    ソフトウェア・仮想化

    AIエージェントを野放しにしない ― ServiceNowは“AI司令塔”で自律とガバナンスを両立

  10. 10位

    ソフトウェア・仮想化

    日本の自治体がみんな使っている「ManageEngine」 IT運用のすべての課題解決を目指す

集計期間:
2026年05月14日~2026年05月20日
  • 角川アスキー総合研究所