今回取り上げた音声認識ソフトの中では最後発となる東芝の「LaLa Voice2001」(以下LaLa Voice)は、気負わず手軽に音声認識を利用するためのツールや工夫が盛り込まれたソフトだ。
エンロールがまるごとなくなった! “即”使える
導入時に文を読み上げるのは、マイクレベルの調整のみ。機能としてのエンロールがない!! |
「すぐに使える」がウリの本製品は、驚くべきことにエンロールの項目がない! ほかのソフトに見られるような簡易エンロールといった次元ではなく、エンロールという概念が最初からないのだ! 導入時には、話者(ソフトを使うユーザー)が男性、女性もしくは男女共通(声の高い男性やハスキーヴォイスの女性を想定したもの)のいずれかを選び、あとはマイクレベルの調整のために1文8文字程度の本当に短い5つの文章を読むだけですぐに使える。
エンロールが不要となると「認識精度に問題があるのではないか?」と思うだろうが、実際に使用してみるとほかのソフトと比較してもほとんど大差なかった。使い込んでいくと差が現れるかもしれないが、まったく問題ないレベルだといえるだろう(精度については「認識精度比較」を参照)。
メインの操作とディクテーション
左のバーが、LaLa Voiceの各機能を呼び出すメニューバーだ。一番上のアイコン「声で入力&読上げ」をクリックして、音声で文章入力するための「LaLa Voiceテキスト」を起動する。 |
LaLa Voiceを起動すると、最初に表示されるのがLaLa Voiceの各機能を呼び出すメインメニューだ。このメニューも、文字付きのカラフルなデザインのアイコンを配置した縦長のバーで、親しみやすくわかりやすい。
音声で文章を入力するには「LaLa Voiceテキスト」(メニューの“声で入力&読上げ”)を利用するが、このツール単体では、純粋に音声からのテキスト化のみ可能で、ウィンドウ内の操作や文字の修正はキーボードとマウスで行う。
ウィンドウやアプリを音声で操作する「LaLa Voiceコマンド」(メニューの“声でパソコン操作”)を起動してタスクトレイに常駐した状態なら、LaLa Voiceテキスト内の音声による操作も可能だ。ただし、一度音声による文字入力を開始すると、それを解除するにはマウスで停止しなければならず、すべてを声だけでは操作できないのは難儀だ。
ただ、このように音声によるパソコン操作と文字入力が別々になっていると、文章を音声で入力中に、誤って音声コマンドが実行されてしまうといった事がなく、安心して大量の文章が入力できるというメリットもある。
残念ながら、ほかのアプリ上に直接音声で文字入力する「インライン入力機能」はサポートしておらず、基本的にLaLa Voiceテキストで入力したテキストを転送するして起動中のアプリへ入力することになる。ただし、Microsoft Word、Microsoft Excel、Microsoft Outlook(すべてバージョンは97以降)では、あらかじめ用意されているマクロを各アプリに登録することでインライン入力が可能になる。
入力された文字や開いたテキストは、「読み上げ開始」アイコンをクリックすると、表示されているキャラクターの声(画面の場合は「お姉さん」)で読み上げられる。試しに別途タイプしたテキストを開いて読み上げさせてみたところ、今回紹介したソフトの中では一番自然に聞こえた。読み上げキャラクターはお姉さん以外に、ロボットA(大人)、お坊ちゃん、おばあさんなど全9種類が用意されており、気分によって読み上げるキャラクタを変えるという楽しみ方もできる。また、読みとアクセント位置の指定を行うことで任意の語をより自然に読み上げさせる「音声合成辞書登録機能」もあり、音声合成ではほかのソフトより多機能だ。
文字修正と音声コマンドの使い勝手
修正はいたって簡単で、修正したい文字の前にカーソルを置いてダブルクリック。修正候補ウィンドウに正しい語があればそれを選び、なければキーボードタイプで修正する。 |
入力した文字の修正方法は、上記で説明したとおりLaLa Voiceテキストではマウスを使って行うので、さほど難しくない。誤入力された文字を修正するには、修正したい語の前でダブルクリックして、表示される修正候補ウィンドウから適切な文字を選ぶか、キーボードでタイプして訂正を行うといった具合になる。
音声によるアプリ操作は、音声コマンドリストを表示していれば、アクティブになっているウィンドウ内で実行できるコマンドが一覧表示されるのでさほど迷うことはない。また実際に使ってみても、誤入力で全然違うコマンドが実行されてしまうといったこともなく快適に操作できた。
おもしろ機能満載!
基本機能以外には、Webサイト内の文章を音声合成で読み上げる「LaLa Voice Web」(メニューは“Webの読上げ”)がある。中でも、ほかのソフトにはない「早送り」機能は、不要な部分を飛ばすことができ、非常に重宝する。
「LaLa Voice LaLaSong」を起動すると、五線譜が表示される。左側のバーにある音符を配置し、連続もしくは一音ごとに歌詞を入力すると、音声合成でキャラクタが歌ってくれる機能だ。 |
本ソフト独自のおもしろい機能に、音符をマウスで配置して作曲や音声合成で歌を歌わせる「LaLa Voice LaLaSong」、かわいいうさぎのキャラクタ「すぅぱぁみみ」が登場し、デスクトップ付箋紙機能やスケジュール管理ができて設定した時間になると音声で知らせてくれる「LaLa Voice アシスタント」がある。すぅぱぁみみと会話ができるスクリーンセーバもあり、会話のやりとりはあらかじめ登録した呼びかけと返事によって行われ、それ以外に「いまなんじ?」と聞けば時刻を教えてくれる機能も備えている。
「LaLa Voice アシスタント」では、“すぅぱぁみみ”が現れて予定を設定した時間の5分前(1分単位で指定可能)に音声で知らせてくれる。 |
また、メニューの「アクセサリ」から呼び出す「LaLa Voice メール」は、メールの着信を声で知らせてくれるもので、MAPI対応であれば送信者やタイトル、メール本文も読み上げる。このほか、押したキーの名前(「A」なら「エー」)を読み上げる「LaLa Voice キーボード」や、警告や注意ダイアログ内の文字が読み上げる「LaLa Voice メッセージ」など一風変わった機能を装備している。
認識精度から言っても、仕事でバリバリ使いたいという人や、アプリもWindowsもすべて音声で操作したいという人には不向きだが、趣味としてPCを気軽に楽しみたいという人にはもってこいのソフトといえるだろう。
製品名 | LaLa Voice2001 |
---|---|
価格 | 1万6000円 |
会社名 | 東芝 |
問い合わせ先 | 0570-00-3100 |
URL | http://www2.toshiba.co.jp/ |
動作環境 | |
CPU | MMX Pentium-266MHz以上 |
メモリ | 64MB |
空きHDD容量 | 180MB |
対応OS | Windows 98 SE/ME/2000 |
仕様比較 | |
導入後最初の起動時間 | 0秒 |
簡易エンロール時間 | - |
フルエンロール時間 | - |
音声認識辞書(最大) | 約10万5千語 |
登録可能語句数 | 1万語 |
音声読み上げ機能 (音声合成エンジンの搭載) |
○ |
Webブラウズ機能 | ○ |
メールチェック機能 | ○ |
音声コマンドカスタマイズ機能 | × |
句読点の自動挿入機能 | × |
声によるマウス操作 | × |
声によるキーボード操作(押す) | × |
語彙のまとめ登録機能 | × |
ICレコーダ対応 | △自社ICレコーダのみ対応 |
WAVEファイルからの書き起こし | △要ICレコーダ付属のツール |
付属アプリ、もしくは 別途インストールが必要なソフト |
特になし |