このページの本文へ

前へ 1 2 次へ

Apple Geeks 第59回

iPhone 4Sで話題の「Siri」、その機能を読み解く

2011年10月07日 22時00分更新

文● 海上忍

  • この記事をはてなブックマークに追加
  • 本文印刷

サードパーティーにもAPIを開放

 デモでは、位置情報を用いるグルメ情報検索アプリ「Yelp」を利用し、パロアルト近辺のギリシャレストランを検索していた。当初は自社開発アプリのみ使用を許可した「AirPlay」と比べると、サードパーティーへのAPI開放に対し意欲的なことが分かる。

 これは推測だが、音声入力用の「コマンド」に含まれる多頻出の単語はAPIレベルで抽象化されると仮定しても、地名など固有名詞はデベロッパー側で用意しなければならないはず。たとえば、「×××をタップ」というコマンドの「×××」がアプリ固有だとすると、「×××」の音声データはアプリが対応する言語ごとに必要だからだ。そうなると、動作確認など開発コストの増加が予想され、資金力のあるデベロッパーでなければ世界展開可能なアプリの開発が難しくなる可能性も出てくる。

サードパーティー製のグルメ情報検索アプリ「Yelp」がSiriに対応したことが判明

Yelp App
価格無料 作者Yelp
バージョン5.4.2 ファイル容量13.6MB
カテゴリー旅行 ユーザーの評価(2.5)
対応デバイス全機種 対応OSiOS 4.0以降

日本語対応は楽観できる?

 残念ながら、iPhone 4SおよびiOS 5のリリース時点では、Siriは日本語をサポートしない。当初は英語(米/英/豪)とドイツ語、フランスという3ヵ国語でスタート、という日本語を母語とする我々にとってはさみしい内容となっている。

 具体的な言及はなかったが、Siriの音声認識エンジンはNuance Communications(ニュアンス コミュニケーションズ)のものであると推定される。その理由は、これまで「Siri Assistant」として米国のApp Storeで公開されていたiOSアプリ(10月7日時点ではダウンロードできない)には、Nuanceの技術がバックエンドに採用されていたからだ。

 Nuanceの音声認識技術は、デスクトップPC向け製品の一部機能を除き、基本的にクラウド上に実装されている(関連記事1関連記事2)。デバイス側にはUIと比較的小規模なライブラリーがあるのみで、基本的には音声などのデータをクラウドと送受信するための存在に過ぎない。

 もはやSiri Assistantを入手することはできないが、Nuanceの音声認識技術は日本のApp Storeで公開中の「Dragon Dictation」でテストできる。もちろん日本語に対応しているので、(iPhone 4Sに採用された)SiriのバックエンドがNuanceのものと仮定すれば、日本語の認識精度も相当高いレベルにあることが分かるはずだ。

「Dragon Dictation」を使ったテスト。「今週の営業会議は金曜日9時、会議室で」のつもりでiPhoneに話しかけたところ、かな漢字変換を含め正確に1回で入力できた

 では、なぜ日本語がサポートされなかったか……音声データのサンプル数不足か、日本語はたまたま“言語サポート第2陣”に仕分けられただけなのか、それともさらなる機能追加へのタイミング待ちなのか。現状はあくまでベータ段階、しかもSiriの対応言語追加方針は明言されているので、楽観的に待ちたいと思う。

Dragon Dictation App
価格無料 作者Nuance Communications
バージョン2.0.12 ファイル容量6.6MB
カテゴリービジネス ユーザーの評価(3.0)
対応デバイス全機種 対応OSiOS 4.0以降
Dragon Search App
価格無料 作者Nuance Communications
バージョン1.3.12 ファイル容量4.2MB
カテゴリーユーティリティ ユーザーの評価(3.0)
対応デバイス全機種 対応OSiOS 4.0以降

前へ 1 2 次へ

カテゴリートップへ

この連載の記事

ASCII.jp RSS2.0 配信中