このページの本文へ

前へ 1 2 次へ

  • はてなブックマークに登録
  • del.icio.usに登録
  • livedoorクリップに登録
  • Buzzurlに登録
  • StumbleUponに登録
  • Google Bookmarksに登録
  • Facebookでシェア
  • Yahoo!ブックマークに登録
  • お気に入りに登録
  • 本文印刷

KDDI、携帯電話向け音声認識技術“声de入力”を発表――“EZナビゲーション”に対応機能を追加

2006年01月12日 17時56分更新

文● 編集部 伊藤咲子/水野輝夫

KDDI(株)と沖縄セルラー電話(株)は12日、“au”ブランドの携帯電話機向けに開発された分散型音声認識機能“声de入力”を発表した。歩行者向けナビゲーションサービス“EZナビゲーション”の乗換検索/目的地検索メニューに、テンキー以外の新しい文字入力補助機能として用いられる。声de入力の対応機種として、第3世代携帯電話サービス“CDMA 1X”向けの『A5518SA』『Sweets pure』『ジュニアケータイ A5520SA』を、2月上旬以降に発売する。いずれも製造は三洋電機(株)で、価格はオープンプライス。

A5518SA Sweets pure ジュニアケータイ A5520SA
A5518SASweets pureジュニアケータイ A5520SA


音声認識機能を端末側とサーバー側に分散

KDDI au商品企画本部 モバイルサービス部 サービスグループ 課長の幡 容子氏
KDDI au商品企画本部 モバイルサービス部 サービスグループ 課長の幡 容子氏

記者説明会に出席したKDDI au商品企画本部 モバイルサービス部 サービスグループ 課長の幡 容子(はた ようこ)氏によれば、こうした方式の音声認識機能を携帯電話機に実装するのは「Windows Mobile搭載機などの汎用OSを搭載したいわゆる“スマートフォン”を除き世界初」という。そもそも文字入力に音声認識技術を採用するにいたった背景については、商品企画のコンセプトの1つとして「(移動通信キャリアーによる)サービス競争が行なわれている一方で、初心に帰って多くのユーザーが簡単に使えるものを」というコンセプトがベースにあり、「テンキーによる入力自体が複雑なのでは」という問いから検討が始まっている。

声de入力で用いられた分散型音声認識(Distributed Speech Recognition)機能は、(株)KDDI研究所が開発した。この名称は、音声認識機能を携帯電話機本体とサービスサーバーに分散することに由来する。ユーザーが携帯電話機に向かって発声すると、携帯電話機側で音声の特徴をパラメーターとして抽出し、それをデータ網を経由してサービスサーバーに送信、サーバー側で辞書(データベース)と照合し結果が送り返される。携帯電話機単独で行なう従来の音声認識機能と比較して辞書の規模や拡張性の面で優れ、また音声通話型の音声認識機能と比較してパケットが比較的少量で行なえるというメリットがある。また声de入力ならではの特徴として、周辺の雑音の採取で処理速度優先/雑音対策優先の2つの認識方法を自動的に使い分ける点が挙げられる。さらに、正しく認識できなかった場合は話頭切断/雑音過多などの原因を判別しユーザーに通知する機能、プルダウンで複数の候補をユーザーに提示する機能などを備えている。



EZナビウォークを使って音声認識で乗換検索

声de入力が最初に採用されたのは、現在提供中のEZナビゲーションの乗換検索/目的地検索メニューで、開発には(株)ナビタイムジャパンが協力している。利用イメージとして、KDDIは移動中のビジネスマンが“歩きながら”“待ちながら”使うような“ながら”検索を挙げている。

KDDIが考える利用イメージ
KDDIが考える利用イメージ

サーバーの音声認識用の辞書には、全国の駅名のほか、施設/店舗名など1万件の単語が収録されている。乗換検索の場合、ユーザーは、画面の指示を見ながら「原宿から九段下まで1月12日の12時に出発」のように、出発駅/到着駅/日時/検索条件を発声する。出発駅と到着駅しか発声しなければ自動的に現在時刻での検索が行なわれ、終電や始発の検索も可能。目的地検索の場合、ユーザーは、「飯田橋の図書館」のように「○○の○○」「○○にある○○○」などと店名/施設名を発声すればよい。

EZナビウォーク画面 EZナビウォーク画面
EZナビウォーク画面。ここで“声で乗換検索”を選択する画面の指示に従って発声する。
分析中の画面 認識結果の画面
発声が終了すると自動的に音声認識が始まる筆者は「原宿から九段下」と発声したのだが、正しく認識されなかった。「声が大きかったため認識結果が正しくない可能性があります」とのメッセージが表示される
認識結果の画面 認識結果の画面
筆者が2回チャレンジしたのだが、いずれも「声が大きい」と正しく認識されなかったので、説明員に交代。「声が大きい」というメッセージは出ているが、正しく認識されたもう一度筆者が発声。気を付けて発声したのだが、今度は「声が大きすぎる」と候補も表示されなかった。周囲は3~4回で認識されているようだったので、地声が大きいのかもしれない

乗換検索を利用するにはEZナビウォークの有料登録が必要で、利用料金は24時間95円、月額210円、月額315円の3コースが用意されている。月額315円のコースは、道路情報や鉄道運行情報も取得できる。

音声認識(発声→サーバーから候補が返って来るまで)にかかるパケット通信料は、CDMA 1Xの“パケ割”に契約した場合で3~4円。CDMA 1X WINの対応機種は現時点で発表されていないが、パケット通信料定額サービスの対象となる。なお、端末やサーバー側にユーザーの発声の特性に合わせて調整するような学習機能はないので、認識の精度を上げるにはユーザー自身が慣れる必要がある。KDDIでは乗換検索を体験できる“お試し”メニューを用意する。

上記サービスは、今後発売されるEZナビゲーション対応端末ですべて利用できる予定だが、端末側に音声認識のソフトウェアを実装している必要があるため(ソフトウェアの追加は不可)、既存のEZナビゲーションサービス対応端末では利用できない。サービス開始は対応端末の発売と同時。なお、EZナビゲーション以外のサービスでの声de入力の実装については、ユーザーの反応をみて検討するという。

前へ 1 2 次へ

ASCII.jpメール デジタルMac/iPodマガジン

ASCII.jp RSS2.0 配信中

ピックアップ

富士通パソコンFMVの直販サイト富士通 WEB MART