このページの本文へ

前へ 1 2 3 次へ

開発者が断言 最新のATOKが最良のATOK

英語入力だけじゃない すべてが進化した「ATOK 2009」

2009年02月17日 08時00分更新

文● 岡本善隆/企画報道編集部

  • この記事をはてなブックマークに追加
  • 本文印刷

 日本語入力において必須となるIME。もちろんWindowsには「MS-IME」が付属するが、より効率的な日本語入力を求めて、別途ATOKシリーズを購入して愛用する人は数多い。そのATOKの最新バージョンである「ATOK 2009」の発売に合わせ、ジャストシステムの関係者にインタビューを行なった。

 お話をうかがったのはATOKプロダクトオーナーの竹原宗生氏、 ATOKビジネスオーナーの井内有美氏、ATOK統括ビジネスオーナーの佐藤洋之氏の計3名である。

2007から継続の変換エンジンをチューニング

ATOK 2009 プレミアム

2月6日に発売されたATOK 2009。写真のプレミアム版には評価が高い「ロングマン英英辞典」も含まれており、英語学習者などには特にお勧め

―― 今回の「ATOK 2009」ですが、まず開発の方向性や方針についてお聞かせください。

竹原氏 最新のATOK 2009に限らず、日本語入力のインフラとしてのATOKということを常々考えています。少々大げさかもしれませんが、パソコンにおけるライフライン(生命線)を提供し続ける使命を帯びている、という考えや方針のもとで開発を続けています。

 とはいえ、ユーザーが一番重要視するのはやはり変換精度だと思います。コアとなるエンジンについては「ATOKハイブリッドコア」という名前を付けてから3年目になります(ATOK 2007で初登場)。ATOK 2009では統計的言語処理の精度をより高めるのと同時に、それによって生じる弊害対策を徹底的に行ないました。

―― 統計的言語処理と弊害対策とは具体的にはどのようなものですか?

竹原氏 2006までのATOKでは「N文節最長一致法」という伝統的なアルゴリズムを用いてきました。N文節最長一致法とは入力した文字列を、より少ない文節で区切るのが正解の可能性が高い、という経験則によって文字列を変換します。その方式でも十分変換精度は高かったのですが、もう一段階変換精度を高めるにはブレイクスルーが必要となってきたのです。

 そこでATOK 2007で新たに加えたのが統計的言語処理です。これはどの単語とどの単語の繋がりが高いかをデータ化したもので、この処理を加えることで、従来は間違って変換していた文字列が正しく変換できるようになりました。

 ただ、今度は逆に文節が短く切られすぎることによる弊害も時々起きるようになったのです。両方の処理をどのようにバランスよく使うかのチューニングを2007、2008、2009と着実に進めて、2009では完成度が非常に高くなったと考えています。

ATOKハイブリッドコア

ジャストシステムのサイトで公開されている変換精度の例。文字列をより少ない文節数で変換しようとするのが、2006までの基本だった。それに対して、単語間の繋がりを統計化して、変換に活用するのが現在のATOKハイブリッドコアである

前へ 1 2 3 次へ

カテゴリートップへ

アスキー・ビジネスセレクション

ASCII.jp ビジネスヘッドライン

ピックアップ