認識精度徹底比較 新聞原稿編
音声認識ソフトで大切なことは、自分が発声した言葉が「正確に」文章としてテキスト化されることと、しゃべったとおりにアプリが動作することだ。
ここでは、インストール直後の環境で、新聞原稿と会話文について読み上げ、各ソフト別にどの程度認識精度が違うのか調査した。マシン環境は以下のとおりだ。
Windows:CPU PentiumIII-800EB、メモリ 256MB
Macintosh(iMac):CPU PowerPC G3 350MHz、メモリ 64MB
新聞原稿と会話文の2種類のテストを行うのには次のような訳がある。
コンピュータにとっては、言葉も音楽も雑音も単なる音の情報でしかない。そこで音声認識ソフトは簡単に説明すると、音の信号をあらかじめ登録された声のパターンと比較して「あ」「う」という語にして、次に並び方から単語を推測する。最後に、単語のつながり具合を見て主語と述語など構文解析を行い、文章にする。
そのため比較的正しい日本語で記述された新聞は認識精度が高く、主語/助詞が省略されたり、「あたしのだ」が「あたしんだ」というようにくだけた言い方には弱い。だが、こうした会話文にも多少対応するようになったとのことなので、その実力を試している。
また、簡易エンロールを行った場合(ソフトによってはエンロールなし)と、フルエンロールを行った場合とでは、どれくらい認識精度が異なるのかも比較してみた。まずは新聞原稿から見ていくとしよう。なお、表の中で、「……」と表記されている部分は、正解であるため省略している。
人間の全遺伝情報(ヒトゲノム)の解読を進めてきた米国のバイオ企業「セレラ・ジェノミクス」と、日米欧政府機関の出資による「国際ヒトゲノム計画」の研究成果が10日、同時公開された。遺伝子の数が従来の推定の約10万個をはるかに下回る3万~4万個で、ショウジョウバエの2倍しかないことが分かるなど、ゲノムの全体像が初めて明らかにされた。解読データは無料で研究者に提供され、遺伝子と病気との関連の研究、新しい治療法や薬剤の開発に結びつくと期待される。(毎日新聞2月12日朝刊1面より抜粋) |
製品名 | 簡易エンロール | フルエンロール |
---|---|---|
LaLa Voice2001 | 96% | なし |
人間の全遺伝情報(ヒトゲノム)の解読を……日米豪政府機関の……約10万個をはるかに下回る3万~4万戸で、小乗馬への2杯しかないことが……。 | - | |
SmartVoice Ver.4.0i | 97% | 99% |
人間の善意遺伝情報(ヒトゲノム)の……約十万個をはるかに下回る三万~四万戸で、ショウジョウバエの二倍しかないことが分かるなど……遺伝子と狂気との関連の研究……。 | 人間の全遺伝情報(ヒトゲノム)の……三万~四万戸で……遺伝子と病気との関連の研究……。 | |
ViaVoice Pro V8(Windows) | 92% | 97% |
人間の全遺伝情報(1日の分)の解読を進めてきた英国の場よき業……「国際1日の無計画」の……40,000戸で、ショウジョウバエの……、下の者全体10日初めて明らかにされた。……。 | 人間の全遺伝情報(1ゲノム)の……「国際一美の無計画」の……40,000戸で、……ゲノムの全体像が初めて明らかにされた。……。 | |
ドラゴンスピーチ セレクトVer.5.0 | 92% | 95% |
人間の善意元情報(1ゲノム)の……出資による「国際1ゲノム計画」の……約10万戸をはるかに下回る3万から4万戸で、症状倍の2倍しか……。 | 人間の全遺伝情報(1ゲノム)の……「国際1ゲノム計画」の……推定の約10万戸をはるかに下回る3万から4万戸で、症状倍の2倍しか……。 | |
ViaVoice ミレニアム for Macintosh | 78% | 88% |
人間の善意現場も)人気の部】土地の改革を進めてきた……日米王政復帰かの趣旨による「国際人気の無計画」の研究成果が10日、当地公開された。……40,000戸で、ショウジョウバエ像……下の者全体増加初めて……遺伝子取って置きとの関連……。 | 人間の全遺伝情報(1ゲノム)の解読を……出資による「国際ヒトデの無計画」の……40,000戸で、ショウジョウバエの2台しか……ゲノムの全体像が……無料で研究支援提供され、移転人病気との関連の……。 |
やはり新聞原稿の結果は認識精度が高い。ほとんどのソフトが新聞では90%以上という高い数値を打ち出している。数値の差は、「ヒトゲノム」「ショウジョウバエ」という単語(専門用語や固有名詞)が最初から音声認識辞書に登録されているか否かに起因している。こうした単語は、単語登録を行えばいいだけなので、実用上大きな問題ではないだろう。