12月1日まで、千葉・開催中の幕張メッセで開催中のInternet World Japan 2000では、eビジネス系の展示が大勢を占めたが、その中で数は少ないもののいくつか目新しい技術を紹介していたブースを紹介する。
インストール無しで47ヵ国語の入力ができるシステム
イスラエルで企業向けのソフトウェアを開発しているSlangsoft社が展示していたのが、各国語のIMEをインストールすること無しに、47ヵ国語の入力と表示ができる“iTID(intelligent Text Input and Display)技術”。この技術は、Internet ExplorerやNetscape Navigatorなどのユニコードに対応したウェブブラウザーとJavaを利用したもので、ローカルマシンには数100KBのJavaアプレットのみがダウンロードされ、日本語の変換辞書はサーバー側に用意されている。また、表示に必要な日本語フォントはSlangsoft社独自のレンダリングエンジンによって表示され、漢字3000字のフォントファイルが28KBに収まるという。
SlangsoftのiTID技術のデモ画面。日本語入力ではローマ字と仮名が選べる |
入力可能な言語は、日本語、韓国語、中国語などのアジア言語や、ヨーロッパ圏の言語など47ヵ国語に対応し、一度に複数の言語を表示させることも可能。基本的にJavaが動作し、ユニコードの表示ができるブラウザーならばOSは問わずに動作する。PDAやセットトップボックスでも利用できるとしている。
Pocket PCエミュレーターでもiTIDを動作させていた |
・Slangsoft(http://www.slangsoft.com/)
トレーニング無しで高い認識率の音声認識エンジン
(株)アドバンスト・メディアのブースでは、音声認識エンジンの“AmiVoice”のデモを行なっていた。AmiVoiceは米カーネギーメロン大学で開発された音声認識技術を元に開発された、不特定話者対応で事前トレーニングなしで高い認識率を達成したとしている。通常の音声認識エンジンでは、事前にある程度のトレーニングが必要なことが多く、また、イントネーションやアクセント、話すスピードが変わると認識率が低下するというが、AmiVoiceではこのような条件の変化にも強いことが特徴としている。
アドバンスト・メディアのステージでは、画面につぎつぎ登場する単語を来場者に読ませて認識させるというデモを行なっていた |
アドバンスト・メディアでは、この認識エンジンを開発キットとして提供しており、一般ユーザーに直接販売は行なっていない。(株)デジキューブのキオスク端末“デジタルコンテンツターミナル”にAmiVoiceの認識エンジンが組み込まれているという。また、Internet Worldでは、認識エンジンをActiveXコンポーネントとしてウェブに配置し、音声でナビゲーションできるウェブサイトが構築できるという“AmiVoiceWebソリューション”の展示を行なった。この技術を利用したサイトは来年春ころ登場する見込みとしている。
(株)インディビジオが運営するコミック販売サイト“フランケン”で、音声でナビゲートするエージェント(画面中央右)の導入を予定している。このエージェントの音声認識技術としてAmiVoiceが利用される |
“フランケン”のエージェント |
・アドバンスト・メディア(http://www.advanced-media.co.jp/)
音声と連動した3Dキャラクター作成システム
(株)スリーディーが展示していたのは3Dキャラクター作成システム『AVATAR SDK』。WindowsのスピーチAPIに対応して、音声認識や音声合成機能とキャラクターの動きを同期させることができるという。
スリーディーの3次元キャラクター作成システム『AVATAR SDK』 |
AVATAR SDKで作成したキャラクターの動作デモ。口の動きと音声が同期している |