日本語入力において必須となるIME。もちろんWindowsには「MS-IME」が付属するが、より効率的な日本語入力を求めて、別途ATOKシリーズを購入して愛用する人は数多い。そのATOKの最新バージョンである「ATOK 2009」の発売に合わせ、ジャストシステムの関係者にインタビューを行なった。
お話をうかがったのはATOKプロダクトオーナーの竹原宗生氏、 ATOKビジネスオーナーの井内有美氏、ATOK統括ビジネスオーナーの佐藤洋之氏の計3名である。
2007から継続の変換エンジンをチューニング
―― 今回の「ATOK 2009」ですが、まず開発の方向性や方針についてお聞かせください。
竹原氏 最新のATOK 2009に限らず、日本語入力のインフラとしてのATOKということを常々考えています。少々大げさかもしれませんが、パソコンにおけるライフライン(生命線)を提供し続ける使命を帯びている、という考えや方針のもとで開発を続けています。
とはいえ、ユーザーが一番重要視するのはやはり変換精度だと思います。コアとなるエンジンについては「ATOKハイブリッドコア」という名前を付けてから3年目になります(ATOK 2007で初登場)。ATOK 2009では統計的言語処理の精度をより高めるのと同時に、それによって生じる弊害対策を徹底的に行ないました。
―― 統計的言語処理と弊害対策とは具体的にはどのようなものですか?
竹原氏 2006までのATOKでは「N文節最長一致法」という伝統的なアルゴリズムを用いてきました。N文節最長一致法とは入力した文字列を、より少ない文節で区切るのが正解の可能性が高い、という経験則によって文字列を変換します。その方式でも十分変換精度は高かったのですが、もう一段階変換精度を高めるにはブレイクスルーが必要となってきたのです。
そこでATOK 2007で新たに加えたのが統計的言語処理です。これはどの単語とどの単語の繋がりが高いかをデータ化したもので、この処理を加えることで、従来は間違って変換していた文字列が正しく変換できるようになりました。
ただ、今度は逆に文節が短く切られすぎることによる弊害も時々起きるようになったのです。両方の処理をどのようにバランスよく使うかのチューニングを2007、2008、2009と着実に進めて、2009では完成度が非常に高くなったと考えています。