このページの本文へ

前へ 1 2 次へ

検索データベースとの連携で最強のIMEとなるか?

Google日本語入力が描くIMEの未来像とは?

2009年12月04日 11時20分更新

文● 松本淳

  • この記事をはてなブックマークに追加
  • 本文印刷

 2009年12月3日、グーグルは突如「Google日本語入力」を公開した。

昨日発表されたGoogle日本語入力。すでに各所で話題になっている

 対応OSは現在のところ、Mac OS X以降ならびにWindows XP以降(64bit版には未対応)で、同社サイトからダウンロードし、無料で利用できる。Google Japan Blogによれば、Google日本語入力は、有名な20%プロジェクトから生まれたという。筆者は長くATOKを愛用している一人だが、早速、Google日本語入力で執筆しながら考えていこう。


従来の変換エンジンとは異なる発想から生まれたIME

 Google Japan Blogによると、この日本語入力システムが、従来の発想とは異なるものであると表明されている。

 Web から機械的・自動的に辞書を生成することで、人手ではカバーしきれないような、新語、専門用語、芸能人の名前などを網羅的に収録しています。高い変換精度を実現するために、Web上の大量のデータから統計的言語モデルを構築し、変換エンジンを構成しています。現在の Webのありのままを反映したインプットメソッドと言えます

 つまり、ネットからグーグルが集約した膨大なインデックスデータを使い、同時に生成された辞書を利用するわけだ。

 ローカルディスク上に辞書をファイルを持つ従来のIMEとは異なる発想である。これまでもネット上で辞書を共有するSocial IMEのアプローチがあった。これと同様に、ネット上のデータや不特定多数のユーザーの利用履歴を収集し、変換候補を引き出してくる点が面白い。

 今風に言えば「クラウド型」の日本語入力システムと言えるだろう。なお、ブログエントリーの補足にもあるように、ウェブ上のデータを参照しながら変換していく仕組みではあるが、オフラインの状態でも問題なく利用することができた。


単語や文節単位では軽快──しかし、文脈の中ではどうか?

 ここまでGoogle日本語入力を利用して原稿を書いてきた。

数文字入力すると、変換候補が下にリスト表示される。タブキーを押すと選択が可能だ

 特段、変換精度を意識することはない。意識せず使えるというのは、IMEにとって非常に重要な意味を持つ。スペースで変換する点は従来のIMEと変わらないが、数文字打ち込むと下に入力候補が表示される。タブキーを押すことで推測変換やサジェスチョンの機能が利用でき、少ないタイプ数で効率よく文字を打てる。

 ATOK同様に「今日」や「今年」という単語から、「2009年12月3日」や「平成21年」といった変換結果を得ることもできる。

 タスクマネージャで確認したところ、メモリーの占有率も比較的低いようだ。レスポンスに関しては(すでに色々言われているが)遅くはない。「サクサク動いている」という感覚もある程度実感できる。

 ただし、既存のIMEに比べ劣る点がないわけではない。

 例えば連文節変換の精度。ATOKには前後の文脈を参照して、検索候補の優先順位を変える機能が備わっているが、現在のところGoogle日本語入力には、明示的にそのような機能はない。また、文章の誤用を指摘して修正候補を挙げる校正機能もないため、それらの機能を重宝していた編集者などのユーザーがすぐに移行するのは難しい面もありそうだ。

 逆に言えば、そういった機能が割愛されている分、軽快に動作しているとも言える。強みは単語の鮮度と、サジェストの精度にあると言えるだろう。バージョンアップで辞書が強化されてきた従来のIMEとは基本的に異なる。

前へ 1 2 次へ

ASCII.jp ビジネスヘッドライン

ピックアップ