このページの本文へ

米VerbalTek社、音声認識で、携帯インターネットサービスを利用できる『VerbalWAP』を発表

2000年06月22日 00時00分更新

文● 編集部 小林久

  • この記事をはてなブックマークに追加
  • 本文印刷

米VerbalTek社は、22日、携帯電話/PDA用の音声認識/検索エンジン『VerbalWAP』(バーバルワップ)を発表した。波形分析を基本としたコンパクトな音声認識エンジンを搭載し、WAPやiモードなど携帯電話用のコンテンツサービスの情報を音声操作で取得できる。国内代理店は、日商エレクトロニクス(株)とユニバース・エレクトロン(株)の2社が担当する予定。

米VerbalTek社のジェームズ・パンCEO
米VerbalTek社のジェームズ・パンCEO



VerbalTekは、'99年3月にスタンフォード大学の研究者が中心になって設立したベンチャー企業で、現在社員数は40名。現在、米国カリフォルニア州サンノゼのほか、台湾とスイスにオフィスを持っている。また、今秋をめどに日本法人の設立も予定しているという。

本日行なわれた発表会では、同社のCEOを務めるジェームズ・パン(James Pan)氏が来日。VerbalWAPのメリットについてコメントした。

パン氏は「音声ガイダンスと番号入力で情報を得る従来の情報サービス(ボイス・ポータル)では、情報を聞き逃しやすいし、メモなどを取らないと覚えきれない。また、導入時には、1回線あたり平均2000ドル(約21万円)の高いコストがかかる」と指摘。一方、VerbalWAPとiモード/WAPを組み合わせたサービスでは、「取得した情報をテキストデータとして残せ、かつ既存のインターネットのインフラを利用できるため、導入時のコストも非常に少ない」と述べた。

VerbalWAPは、音声認識エンジン部が約20KB、音声データベース(日本語、中国語、韓国語などの音素情報)が30~40KB程度と非常にコンパクトなのが特徴。携帯電話やPDAのインターネットブラウザーと組み合わせて使用し、テキスト化した音声情報をインターネットを介して『VerbalWAP』のサーバーソフトに送信。データベース検索ができる。

基本的にブラウザーは選ばないが、当初は(株)アクセスの『NerFront』やPhone.com社のWAP対応ブラウザー『U.P.Browser』などに対応。それ以外の携帯電話用ブラウザーに関しては、カスタムで対応する。音声認識率は、100人の人名を男女4人ずつの計8人で読み上げたテストで約98パーセント。現状ではPalmOS、Windows CE、組み込みLinux用に対応するほか、受注次第で他のOSにも対応できるという。

今回の発表会では、カシオ計算機のWindows CE端末を携帯電話で同社のサーバーに接続し、音声操作で株価情報を取得するデモンストレーションが行なわれた。接続の際のネゴシエーションなどで、10秒程度待たされるものの、音声認識は瞬時。“ソフトバンク”などの社名を的確に認識していた。携帯電話での漢字入力が非常に面倒であることを考えると、期待できる技術と言えるだろう。



発表会で行なわれたVerbalWAPのデモ。株の銘柄名を音声で読み上げる(上)と、自動的にサーバーにアクセスし、その株価情報が表示される(下) 発表会で行なわれたVerbalWAPのデモ。株の銘柄名を音声で読み上げる(上)と、自動的にサーバーにアクセスし、その株価情報が表示される(下)



なお、同社では同じ認識エンジンを利用し、携帯端末内のデーターにアクセスするための『Verbal Input』、より制限されたスペックで動作する『Verbal Command』という製品も発表しており、VerbalWAPと合わせて販売していく。

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン