日本電気(株)は29日、映像/音声コンテンツに含まれる音声から話題(トピック)の変化を検出し、話題ごとに分割する“トピック分割技術”を開発したと発表した。
ニュースを音声認識 | 認識結果を話題ごとに分割 |
映像/音声コンテンツでは、現在、電子番組表(EPG)やコンテンツに付加されている字幕などの“メタデータ”(関連情報)をキーワード検索することにより、視聴したいコンテンツを探す方法が採用されているが、メタデータの作成に大きなコストがかかる、キーワードによる単純な検索では意味のある単位での視聴が難しい、といった問題点がある。
同社が開発した“トピック分割技術”は、自然な話し言葉をテキスト(文章)に変換する音声認識技術と、テキストを意味のあるまとまりに切り分けるテキスト分割技術を基にしたもの。特徴は、- 話題が違えば語やフレーズの出現傾向も違うという“話題間の差異”により話題を分割
- 話題の移り変わりを数理的なモデル(隠れマルコフモデル)を使ってコンテンツ全体から総合的に判断
- 人工知能分野の最新の学習アルゴリズム(変分ベイズ法)を応用することで複雑なコンテンツに対しても高い精度で話題の変化を検出
の3点。
同社では、この技術を利用することで、デジタル放送網やインターネット上で大量に流通する映像/音声コンテンツを、話題ごとに検索/頭出し/視聴/閲覧できるようになるため、映像コンテンツの効率的な提供と視聴が可能になるとしている。