コンピューター関連技術は昔も今も日進月歩の勢いだが、話が「インターフェース」になるとトーンダウンしてしまう傾向は否めない。マルチタッチパネルなどの新顔も増えつつあるが、いまだキーボードとマウスが主役だ。
しかし、人の言葉を解析しテキストに変換する「音声入力」は、近年目覚ましい進歩を見せている。今回紹介するiOSアプリ「Dragon Dictation」も音声入力処理系のひとつで、米Nuance Communications(ニュアンス コミュニケーションズ)の音声認識技術を活用し、日本語を含む各種言語を分析しテキストに変換してくれる。「どうせ誤変換だらけだろ?」などとあなどることなかれ、精度はかなりのもの。それでは早速、その実力のほどを検証してみよう。
![]() |
|||
Dragon Dictation | |||
---|---|---|---|
作者 | Nuance Communications | 価格 | 無料 |
ファイル容量 | 5.1MB | カテゴリ | ビジネス |
対応デバイス | iPhone/iPod touch およびiPad互換 |
対応OS | iOS 4.0以降 |
組み込み系やWindowsで実績ある音声認識エンジンを搭載
米Nuance Communicationsは、音声や画像の認識システムを得意とするソフトウェアベンダー。カーナビゲーションシステムや携帯電話など、いわゆる組み込み系に多くの採用実績を持つほか、Windows向けに「Dragon NaturallySpeaking」という音声認識パッケージソフトを展開している。その技術を生かして開発されたiOSアプリが、今回紹介するDragon Dictationなのだ。音声入力した文字列でウェブ検索などを行なえる「Dragon Search」も同時公開されたが、エンジン部分は共通なため、ここではDragon Dictationのみ取り上げる。
![]() |
|||
Dragon Search | |||
---|---|---|---|
作者 | Nuance Communications | 価格 | 無料 |
ファイル容量 | 3.1MB | カテゴリ | ユーティリティ |
対応デバイス | iPhone/iPod touch およびiPad互換 |
対応OS | iOS 4.0以降 |
Dragon Dictationは、複数の言語に対応しうる音声認識エンジンを備える。現行バージョンのv2.0.7では、日本語のほか、英語とドイツ語、スペイン語、フランス語とイタリア語の計6ヵ国語に対応しており、しかも英語は英国/米国/オーストラリアの発音に対応するなど、地域ごとの発音やイントネーションの差異が考慮されている。
使い方は簡単。画面中央にあるメッセージ「タップ&ディクテート」の下側、真ん中が赤色のボタンをタップし、iPhoneに話しかけるだけだ。その後、音声入力が終わったところで「完了」をタップする。数秒ほど待てば音声のデータの解析が完了し、その結果がテキストとして表示される。
Appleの方針により、インプットメソッドなどiOSのシステムに近い領域はサードパーティーに開放されていないため、Dragon Dictationで音声入力したテキストは直接他のアプリでは利用できない。しかし、画面下部右側にある矢印のようなボタンをタップすれば、テキスト全文をコピーできる。コピー先がSMS/メール/Facebook/Twitterであればさらに簡単で、目的のアプリアイコンをタップするだけで、新規メッセージにテキスト全文が貼り付けられる。なお、FacebookとTwitterは事前のアカウント登録が必要だ。
(次ページへ続く)
