これまで、ポッドキャストや音声を伴う動画が増えてきたのに、テキストを検索できるサイトは数多くあれども、音声を検索できるサイトはなかなかなかった。しかし、産業技術総合研究所の情報技術研究部門メディアインタラクショングループでは、ユーザーの協力により日々性能が向上する音声情報検索技術を開発し、インターネット上にあるポッドキャストの日本語音声データを対象とした検索サービス「PodCastle」(ポッドキャッスル)を一般公開し、実証実験を開始した。
これまでもネット上で音声認識技術の研究はあったものの、音声データの誤認識が多かったり、次々と登場する新語に対応できなかったりという弱みがあった。しかしこのPodCastleでは、不特定多数のユーザーの協力を得て、誤認識を訂正できるインターフェースを開発。さらにウェブ上の日本語ポッドキャストの全文検索を提供し、次々と出現する新語を自動学習する機能も組み込まれる。最新の話題を含む音声データ認識の精度も上がり、検索機能としても実用に耐えうるものとなっているという。
現在は実証実験段階だが、この研究で培われつつある「日々成長する」音声認識システムが実用化されれば、ウェブサービスや、ロボット、コールセンター、会議議事録作成など多方面で応用され、より便利な世の中になるだろう。