このページの本文へ

沖電気とKDDI研、携帯電話越しの音声認識技術を使った交通情報サービス実験を実施

2001年07月02日 18時50分更新

文● 編集部 佐々木千之

  • この記事をはてなブックマークに追加
  • 本文印刷

沖電気工業(株)と(株)KDDI研究所は2日、KDDI研究所が開発した音声認識技術を使った、音声による交通情報提供サービス“ITS(※1)音声ポータルサービス”の実証実験を行なったと発表した。幹線道路脇や走行中の車内からでも97%以上の認識率を得て、年内にも実用化する見通し。

※1 ITS(Intelligent Transportation Systems):高度道路交通システム。交通渋滞や交通事故の低減などを目的としてIT技術の利用によって作り出される、道路交通システムの総称。

“ITS音声ポータルサービス”のサーバーシステム
記者発表会でデモンストレーションが行なわれた“ITS音声ポータルサービス”のサーバーシステム。左側が音声認識サーバー、右側がCTstageサーバー

このITS音声ポータルサービス実験では、音声による対話型応答に対応した沖電気のCTI(Computer Telephony Integration)システム『CTstage(シーティーステージ)』と、音声認識エンジン部分には、KDDI研究所が開発した『SpeechSeeker(スピーチシーカー)』を使用した。実験内容は、静岡県内のゴルフ場に向かう途中というシチュエーションで、携帯電話やPHSを使ってサービスセンターに電話をかけ、音声のガイドに従って目的のゴルフ場の名称を発声すると、現在地からそのゴルフ場までの間の渋滞情報や予想所要時間を返すというもの。

ITS音声ポータルサービスの構成
ITS音声ポータルサービスの構成

実験は、5月と6月に東京都内と神奈川県内で実施した。その結果、交通量の多い道路そばの75dB(デシベル)程度(※2)の騒音下や、走行中の車内から携帯電話を使った場合においても、97%以上という高い認識率を得たという。なお、実験では不特定の話者を想定しており、音声認識率を上げるためのトレーニングなどは行なっていない。

※2 75dB:東京の環状7号線、目黒通り、山手通り、玉川通りなどの幹線道路脇での騒音レベルに相当する。

KDDI研究所マルチメディアインタフェースグループ主任研究員の清水徹氏
KDDI研究所マルチメディアインタフェースグループ主任研究員の清水徹氏

KDDI研究所マルチメディアインタフェースグループ主任研究員の清水徹氏によると、雑音が多い状態での携帯電話経由の音声認識は、携帯電話の音声圧縮による音質劣化とバックグラウンドの雑音の歪みにより、難しいとされてきたが、キャリアーや携帯電話/PHS端末、通話地域によって大きく異なる音質を、それぞれの端末や状況に応じて補正する技術と、、バックグラウンドの雑音と区別する雑音排除技術を開発し、実用レベルの認識率を実現したとしている。

KDDI研究所が開発した携帯電話の音質・ゆがみ補正技術の仕組み
KDDI研究所が開発した携帯電話の音質・ゆがみ補正技術の仕組み。NTTドコモ、J-フォン、auの端末をいろいろな場所、環境で使用して補正用のデータベースを構築したという
KDDI研究所による雑音排除技術の仕組み
KDDI研究所による雑音排除技術の仕組み。携帯電話の音質・ゆがみ補正技術と組み合わせることで、音声認識誤りを3分の1に抑えたとしている

沖電気では、音声によるポータルサービスは、カーナビゲーションシステムなどの専用機器に比べると、処理能力や機能面で制約はあるが、サービスエリアや街頭など携帯電話のサービスエリア内であればどこでも手軽かつ安価に利用できるメリットがあるとしている。多様な応用が考えられるが、沖電気では今回実験を行なった、ゴルフ場までの交通情報サービスから開始する予定。ただし、道路交通情報源として利用する“VICS(ビックス)”(※3)情報が、2001年下半期にオープン化される予定で、本サービスの開始はそれを待って行なう計画。

※3 VICS(Vehicle Information and Communication System):(財)道路交通情報通信システムセンター(VICSセンター)が提供する、カーナビゲーションなどVICS対応機器で利用可能な道路交通情報。渋滞、事故、高速道路の入り口閉鎖、ある地点までの予想所要時間などの情報を、5分ごとに更新して流している。

沖電気工業、交通システム事業部長の片山洸氏
沖電気工業、交通システム事業部長の片山洸氏

ITS音声ポータルサービスの本サービスは、沖電気が主体となって行なう予定で、沖電気工業の交通システム事業部長の片山洸氏は「携帯電話端末ユーザー6700万人のうちの数%が、年間1000円払って利用してもらえれば、年間10~20億円の売上げになる」と述べている。今後の展開としては、観光地やイベント情報の提供なども考えられるとしているほか、今後GPSを搭載した携帯電話が登場すれば、その位置データを利用することで、さらに細かく多彩なサービスが提供可能としている。

携帯電話を使った情報提供サービスでは、iモードをはじめとした携帯電話キャリアーのデータ通信サービスを利用したコンテンツがほとんどだが、沖電気が発表したITS音声ポータルサービスは、音声を使うことでキャリアーや端末を選ばずに利用できる利点がある。音声のみで操作するため、クルマの運転者の利用も可能だとしており、幅広い展開が考えられる。今回は沖電気が自社でサービスを提供するということだが、このCTstageとSpeechSeekerのシステムを利用して、新たなサービスを展開するコンテンツプロバイダーも出てきそうだ。

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン