このページの本文へ

富士通研究所が定精度を70%から97%へ向上させる

説明音声から資料の該当部分をリアルタイムに推定する新技術

2015年04月01日 14時49分更新

文● ASCII.jp編集部

  • この記事をはてなブックマークに追加
  • 本文印刷
共有資料を用いたコミュニケーション支援システムの適用例

 富士通研究所は4月1日、説明音声から資料中の該当箇所をリアルタイムに推定する技術を開発したと発表した。本技術を利用し、説明開始から約2秒で説明箇所の強調表示を行なう設定にした場合、推定精度が70%から97%へ向上したという。

 ポイントは、「認識誤りが発生しにくい音声認識辞書を自動生成する技術」と「統計的に算出した説明順序の特徴から推定精度を向上する技術」の開発。

 声認識において、「色」、「音」、「日」などの語長が3以下の短い単語は類似した発音の単語が多く、誤認識を生じやすい傾向にある。そこで、それらの語長が短い単語を周囲の隣接する単語と結合し、1つの単語として音声認識辞書に登録することで、誤認識を当社従来技術と比較して約60%低減しましたという。

音声認識辞書の自動生成

 また、音声による説明の順序と、資料のレイアウトや段落構造、資料中の説明の記載位置などの文章構成情報との関係を統計的に算出した。すると、資料内で一定距離以上説明箇所が離れると、その箇所に説明が遷移する頻度が急激に低くなるという特徴が分かったという。そこで、このような説明順序の特徴と、説明箇所に含まれる言葉の頻度を利用。次の説明箇所の範囲を絞り、少量の言葉しか認識されていない状態でも説明に対応する該当箇所を高精度に推定できるようになったという。

説明順序の特徴と言葉の頻度を用いた説明箇所推定

カテゴリートップへ

富士通パソコンFMVの直販サイト富士通 WEB MART
富士通
【300*80】 ascii 富士通 WEB MART 個人

製品ラインアップ

ノートブックパソコン/タブレット

  • 富士通
  • 富士通 FMV LIFEBOOK UH
  • 富士通
  • 富士通 FMV LIFEBOOK LH
  • 富士通 arrows Tab QH

デスクトップパソコン

  • 富士通
  • 富士通

その他の注目商品

  • 富士通