このページの本文へ

音声情報の認識・検索サービスを開始

ポッドキャストの音声データを検索できる!

2008年06月30日 15時00分更新

文● 丸子 かおり

  • この記事をはてなブックマークに追加
  • 本文印刷

 これまで、ポッドキャストや音声を伴う動画が増えてきたのに、テキストを検索できるサイトは数多くあれども、音声を検索できるサイトはなかなかなかった。しかし、産業技術総合研究所情報技術研究部門メディアインタラクショングループでは、ユーザーの協力により日々性能が向上する音声情報検索技術を開発し、インターネット上にあるポッドキャストの日本語音声データを対象とした検索サービス「PodCastle」(ポッドキャッスル)を一般公開し、実証実験を開始した。

ポッドキャスト

PodCastleのしくみ。ネットから新語を自動学習し、また誤認識をユーザーが修正することで音声認識結果の精度をあげていく(提供:産業技術総合研究所)

 これまでもネット上で音声認識技術の研究はあったものの、音声データの誤認識が多かったり、次々と登場する新語に対応できなかったりという弱みがあった。しかしこのPodCastleでは、不特定多数のユーザーの協力を得て、誤認識を訂正できるインターフェースを開発。さらにウェブ上の日本語ポッドキャストの全文検索を提供し、次々と出現する新語を自動学習する機能も組み込まれる。最新の話題を含む音声データ認識の精度も上がり、検索機能としても実用に耐えうるものとなっているという。

ポッドキャスト

PodCastleのTOPページと検索結果。様々な音声データの結果が出てきている(提供:産業技術総合研究所)

ポッドキャスト

音声認識の間違いをユーザーが簡単に訂正できるインターフェースになっている(提供:産業技術総合研究所)

 現在は実証実験段階だが、この研究で培われつつある「日々成長する」音声認識システムが実用化されれば、ウェブサービスや、ロボット、コールセンター、会議議事録作成など多方面で応用され、より便利な世の中になるだろう。

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン