このページの本文へ

前へ 1 2 次へ

iPhoneで話し言葉をバッチリ認識! 「Dragon Dictation」

2011年02月10日 12時00分更新

文● 海上忍

  • この記事をはてなブックマークに追加
  • 本文印刷

 コンピューター関連技術は昔も今も日進月歩の勢いだが、話が「インターフェース」になるとトーンダウンしてしまう傾向は否めない。マルチタッチパネルなどの新顔も増えつつあるが、いまだキーボードとマウスが主役だ。

 しかし、人の言葉を解析しテキストに変換する「音声入力」は、近年目覚ましい進歩を見せている。今回紹介するiOSアプリ「Dragon Dictation」も音声入力処理系のひとつで、米Nuance Communications(ニュアンス コミュニケーションズ)の音声認識技術を活用し、日本語を含む各種言語を分析しテキストに変換してくれる。「どうせ誤変換だらけだろ?」などとあなどることなかれ、精度はかなりのもの。それでは早速、その実力のほどを検証してみよう。

Nuance Communicationsの音声入力アプリ「Dragon Dictation」連載「Apple Geeks」のリード文を読み上げたところ。1回しかテストしていないが、「おーえすてん」で「osx」と認識されるなど好印象
Dragon Dictation
作者 Nuance Communications 価格無料
ファイル容量5.1MB カテゴリビジネス
対応デバイスiPhone/iPod touch
およびiPad互換
対応OSiOS 4.0以降

組み込み系やWindowsで実績ある音声認識エンジンを搭載

 米Nuance Communicationsは、音声や画像の認識システムを得意とするソフトウェアベンダー。カーナビゲーションシステムや携帯電話など、いわゆる組み込み系に多くの採用実績を持つほか、Windows向けに「Dragon NaturallySpeaking」という音声認識パッケージソフトを展開している。その技術を生かして開発されたiOSアプリが、今回紹介するDragon Dictationなのだ。音声入力した文字列でウェブ検索などを行なえる「Dragon Search」も同時公開されたが、エンジン部分は共通なため、ここではDragon Dictationのみ取り上げる。

音声入力による検索が可能なアプリ「Dragon Search」もリリース済み。Google、Yahoo、YouTube、Twitter、iTunes、Wikipediaなどの検索が即座に行なえる
Dragon Search
作者 Nuance Communications 価格無料
ファイル容量3.1MB カテゴリユーティリティ
対応デバイスiPhone/iPod touch
およびiPad互換
対応OSiOS 4.0以降

 Dragon Dictationは、複数の言語に対応しうる音声認識エンジンを備える。現行バージョンのv2.0.7では、日本語のほか、英語とドイツ語、スペイン語、フランス語とイタリア語の計6ヵ国語に対応しており、しかも英語は英国/米国/オーストラリアの発音に対応するなど、地域ごとの発音やイントネーションの差異が考慮されている。

日本語のほか英語やスペイン語にも対応する

 使い方は簡単。画面中央にあるメッセージ「タップ&ディクテート」の下側、真ん中が赤色のボタンをタップし、iPhoneに話しかけるだけだ。その後、音声入力が終わったところで「完了」をタップする。数秒ほど待てば音声のデータの解析が完了し、その結果がテキストとして表示される。

画面中央のボタンを押して内蔵マイクに向けて話しかけ、最後に「完了」をタップすればOK

 Appleの方針により、インプットメソッドなどiOSのシステムに近い領域はサードパーティーに開放されていないため、Dragon Dictationで音声入力したテキストは直接他のアプリでは利用できない。しかし、画面下部右側にある矢印のようなボタンをタップすれば、テキスト全文をコピーできる。コピー先がSMS/メール/Facebook/Twitterであればさらに簡単で、目的のアプリアイコンをタップするだけで、新規メッセージにテキスト全文が貼り付けられる。なお、FacebookとTwitterは事前のアカウント登録が必要だ。

認識された文字列はメールやSMSのほか、TwitterやFacebookに送信できる

(次ページへ続く)

前へ 1 2 次へ

ASCII.jp RSS2.0 配信中