日本アイ・ビー・エムの「ViaVoice for Windows Pro Version8」(以下ViaVoice)は、実際の使用を効率良く便利にしてくれる実用的なツールが充実した多機能ソフトだ。
通常使用時の自動学習でエンロール作業を軽減
フルエンロールでは童話「手袋を買いに」や星の話を入れるなど、飽きさせない工夫がされている。また音声入力で文章を入力した結果を自動学習して、ある程度溜まった頃に単語の使用頻度を分析して一気にエンロールを行える機能も搭載している。 |
とにかく機能が豊富なViaVoiceだが、中でもエンロール作業の軽減のために非常にありがたい機能「アンスーパーバイズドエンロール機能」は特筆ものだ。これは、音声で入力したデータを専用エディタ「SpeakPad」もしくはMicrosoft Wordに自動蓄積し、ある程度そのデータが溜まった頃にトレーニング(音声の登録)を行うか尋ねるダイアログボックスを表示して、トレーニングを実行すると、声の特徴に登録されるというもの。
つまり、普段からSpeakPadを使って文章を入力していれば、認識精度が高められるという便利な機能なのだ。とは言っても、最低限クイックエンロールだけは導入時に行わなければならないが、それでもたった6文。時間にして約34秒と短時間で済むので苦にならない。フルエンロールの場合も、内容が童話『手袋を買いに』などを採用して、ユーザーが飽きないような工夫がされている。
基本画面と音声による文書作成
ViaVoiceの標準的な画面。画面上部のバーが「VoiceCenter」で、エディタが「SpeakPad」、右側が現在作業中のウィンドウ(アプリ)で使える音声コマンドを表示する「ボイスコマンドリスト」、鉛筆キャラクタはViaVoiceの使い方などを教えてくれる「音声ヘルプ」だ。 |
ViaVoiceの各機能を呼び出すには、標準ではバーの形状で画面上部に配置されている「VoiceCenter」を利用する。アプリなどの操作を行う音声コマンドに慣れない場合は、音声コマンドリストを表示しておくと、現在操作中のアプリで使える音声コマンドが一覧表示されるので便利。ただ、コマンドリスト表示の際に、一瞬つまったような動作の遅さを感じることもある。
音声で文章を入力するには、
- 専用エディタ「SpeakPad」を使用する「SpeakPadで音声入力」
- Microsoft Wordに直接入力する「ワードで音声入力」
- 一般のアプリでインライン入力を行うの「ダイレクトで音声入力」
の3つのモードが用意される。さらにWordでは、ViaVoiceならではの機能である、「この段落を12ポイントに変更」のような自然な言い方で編集作業ができる音声コマンド「ナチュラルコマンド」が使える。
誤認識された語句を修正するには画面の場合、「単語選択 えいこくの」→「これを修正」→「1番を選択」と発声すればいい。 |
誤認識された文字の修正は、「単語選択○○」→「これを修正」と言って、候補一覧が表示された「修正ウィンドウ」内に、正しい語があれば「3番を選択」のように言うだけなので簡単だ。候補にない場合は、テキストフィールドにキーボードでタイプして修正する。
文章を入力&修正後に表示される「未知語の自動検出」画面。赤い文字で表示された単語が、未登録の単語になる。 |
こうして文章入力し終えた後に登場するのが、第2の便利機能「未知語の自動検出」だ。これは入力された文章を解析し、ViaVoiceの辞書に未登録の単語を見つけ出し、単語登録を一括するという機能。同様の機能として「My Dicitionary ナビ」があり、こちらを使うとHDD内のメール文書/HTML文書/Word文書ファイルから未登録の語彙を見つけ出して、やはりViaVoice辞書に登録できる。この2つを使えば、よく使う単語が誤認識されることがなく、スムーズに入力できるようになるというわけだ。
あれもこれもと、便利機能が盛りだくさん
便利な機能はそれだけで終わらない。アプリ内の一連の作業をマウスで実行しておき、それを一言の発声に登録できる「ナビゲーションマクロ」、入力された音声の品質が悪かったり音声コマンドが認識されにくい場合に、適切なアドバイスと、それに必要な調整画面を表示してくれる「音声認識ウィザード」に、VoiceCenterを親しみやすいキャラクター(ブロッコリー、Wizard)に変更して会話をやりとりするかのように楽しめる機能などがある。
「ボイスマーク」は、ナビゲーションマクロを作成後、その動作の前後に音声合成か録音した音声を再生できる機能。あらかじめ録音したデータならWAVEファイルを指定し、テキストで入力すれば音声合成で読み上げられる。 |
中でもユニークな機能として、ナビゲーションマクロの実行前もしくは実行後に、指定しておいた合成音声やWAVE形式で録音した音声を再生する「ボイスマーク」機能がある。たとえば、新着メールをチェックして振り分けまでをマクロとして登録しておき、実行終了後に「ご主人様のメールは所定の場所に置いてあります」なんて具合にしゃべらせることもできる。
慣れの問題もあるが、使い勝手の点から言うと、ディクテーション中に編集用コマンドを言っても、たまにテキストとして入力されてしまうということや、音声でWebブラウズを楽しむときに「お気に入りの○○へ移動」といえば一発でそのサイトへジャンプできるものの、お気に入りメニューから選びたくて「お気に入り」と言っても、メニューではなくお気に入りフレームが表示されてしまい、サイト選択後にいちいち「閉じる」と言って、フレームを閉じないといけないのは面倒だ。また、ほかのソフトに比べて少々動作が重いようにも思えた。しかし、これだけ多機能なソフトはほかにはないので、音声認識でいろいろためしてみたい人にはピッタリのソフトといえるだろう。
製品名 | ViaVoice Pro V8 |
---|---|
価格 | 1万8000円 |
会社名 | 日本アイ・ビー・エム |
問い合わせ先 | 0120-04-1992 |
URL | http://www.ibm.co.jp/ |
動作環境 | |
CPU | PentiumII-333MHz以上、またはAMD-K6以上(256KB以上L2キャッシュ付き) |
メモリ | 64MB(NT&2000は96MB以上) |
空きHDD容量 | 510MB以上 |
対応OS | Windows 95/98/Me/NT 4.0/2000 |
仕様比較 | |
導入後最初の起動時間 | 3秒83 |
簡易エンロール時間 | 32秒33(6文) |
フルエンロール時間 | 13分6秒68(92文) |
音声認識辞書(最大) | 約10万語 |
登録可能語句数 | 約90万語 |
音声読み上げ機能 (音声合成エンジンの搭載) |
○ |
Webブラウズ機能 | ○ |
メールチェック機能 | △(メーラの機能を音声で使うことは可能) |
音声コマンドカスタマイズ機能 | ○ |
句読点の自動挿入機能 | ○ |
声によるマウス操作 | ○ |
声によるキーボード操作(押す) | × |
語彙のまとめ登録機能 | ○ |
ICレコーダ対応 | ○(SONY ICレコーダの場合は要VoiceATOKエクステンション) |
WAVEファイルからの書き起こし | ○ |
付属アプリ、もしくは 別途インストールが必要なソフト |
ViaVoice使い方ムービー、音声専用住所録「Voiceアドレス」、テキストによる顔文字を音声で簡単入力可能な「顔文字サポート」、スポーツ分野の専門用語を登録した音声認識辞書「スポーツトピック」、「追加エージェント」、地図で指示された地名を音声で答える「マップゲーム」、ゲーム「声でもぐらたたき」、ATOK音声利用拡張ツール「VoiceATOKエクステンション3」、「MS IME音声入力アプレット」、ゲーム「声でクイズ」、連想検索キャラクタ「リッキーくん体験版」「Voice辞スパ体験版」、「My Dicitionary」 |
備考 | 低価格版「ViaVoice for Windows Standard Version8」(9800円)もある。Proから、ボイスマーク機能、「スポーツトピック」、「マップゲーム」、Voice辞スパ体験版、そしてMy Dictionaryナビを省略したもの。 |