このページの本文へ

前へ 1 2 3 次へ

柳谷智宣の「真似したくなるPC活用術」 第21回

音声認識ソフトを使って声で原稿を書く技

2010年07月06日 17時43分更新

文● 柳谷智宣

  • この記事をはてなブックマークに追加
  • 本文印刷

 原稿を書く仕事をしていると、「音声で入力できれば楽なのに……」というシチュエーションがよくある。そんな時は音声認識ソフトの出番だ。日本語の音声認識技術は難しいので、もちろん完璧に認識することはないが、状況によっては実用レベルの入力が可能だ。逆に苦手なシチュエーションもある。今回は音声認識ソフトを使って、原稿を書く技を紹介しよう。


「AmiVoice Es 2008」で音声入力する

AmiVoice Es 2008

AmiVoice Es 2008

 実のところ、個人ユーザー向けのWindows用音声入力ソフトは少ない。現在では、アドバンスト・メディアの「AmiVoice Es 2008」(以下AmiVoice)が一番手に入りやすい製品だ。実売価格はマイクなしが1万8400円、USBマイク同梱版が2万4800円程度となる。AmiVoiceは音声を認識して、リアルタイムにテキストに変換してくれるソフトだ。対応OSはWindows 2000/XP/Vistaとなっているが、試したところWindows 7でも問題なく動作した。

Windows 7上でAmiVoiceを使い音声入力

Windows 7上でAmiVoiceを使い音声入力

【7月9日 追記】AmiVoice Es 2008の後継バージョン「AmiVoice SP」が発表された(ニュースリリース)。Windows XP/Vista/7の64bit版に対応した。価格はマイクなし通常版が2万790円。7月23日から発売の予定。ダウンロード販売も行なわれる。

 AmiVoiceはインストールするだけで使えるようになる手軽なソフトだ。かつての音声認識ソフトのように、ユーザーの声を登録してチューニングする必要はない。マイクはミニプラグ接続のアナログ入力よりも、USB接続のデジタル入力のほうが認識率が高いようだ。今回は製品付属のヘッドセットマイクや、私物のロジクール「Logicool G35 Surround Sound Headset」を使っている。

USBマイク同梱版に付属のヘッドセット

USBマイク同梱版に付属のヘッドセット

 使い方も簡単だ。まずはワープロやテキストエディターを開き、文章を入力したい場所にカーソルを移動させる。続いてAmiVoiceを起動して、右のShiftキーを押すと入力モードに切り替わる。この状態でマイクに向かって話し始めると、「AmiVoiceエディター」が開き、音声入力の結果が表示される。入力が終わったら、ワープロやテキストエディターに転送すればいい。

カーソル位置にツールバーが表示されるので、右Shiftキーを押す

一太郎2010と組み合わせてみた。カーソル位置にツールバーが表示されるので、右Shiftキーを押す

音声で入力する

音声で入力する

テキストを転送して完了

テキストを転送して完了

 マイクの音量が適切なら、認識率は驚くほど高い。自分では「噛んだかな?」と思った発音でも、正しく認識されることもあるほどだ。咳き込んだり、「えーと」といった意味のない音声は認識しないのも賢い。

 筆者は最初、「ぶ ん しょ う にゅう りょく の こ つ」のように、1文字ずつ区切ってしゃべっていた。この方が認識しやすいと思ったからだが、実は大きなお世話のようだ。AmiVoiceは単語よりも文章でしゃべった方が、正しく認識するのだ。発声の仕方も、意識して明瞭にするよりも、普段どおりの方がいい。

 キーボードで入力する時と同じく、改行や文字の削除なども音声でできる。「音声コマンド」を発声することで、記号やコマンドを入力できるのだ。その状態で、例えば「かいぎょー」と発声すれば、Enterキーを押したのと同じになる。「ぴりおど」や「なかぐろ」「すぺーす」などもOK。

 句読点は文脈に併せて自動的に入力されるが、「まる」「てん」と発声して直接入力することも可能。ただ、文章に続いて「まる」と発声すると自動入力と重なってしまい、「。」が2個続くことも多かった。

 発声ミスや認識ミスの場合は、「いちもじさくじょ」と発声する。カーソルを戻したり進めたりも可能。本来は文章として話して入力すべきだが、名詞で一段落してしまった場合など、続く助詞を入力する必要がある。そんなときは「ひらがなのが」のように発声すると「が」がにゅうりょくされる。これは、「を、が、に、は、も、へ、で、と、や」なども同様だ。ワープロやテキストエディターにテキストを入力するには、「てんそう」と言えばいい。

音声コマンドの一例
「まる」。 「てん」、 「かんま」, 「ぴりおど」. 「ころん」:
「はいふん」- 「から」~ 「はてな」?
「かいぎょー」改行処理 「たぶ」 タブを挿入
「いちもじさくじょ」カーソル直前の1文字を削除、1~99文字まで指定可能
「いちもじもどる」「~すすむ」カーソルを1文字戻す・進む、1~99文字まで指定可能
「さいしょ」「さいごにもどる」文頭・文末にカーソルを移動する
「てんそう」AmiVoiceからアプリケーションへテキストを転送する

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン