このページの本文へ

富士通研究所、約8万2000字に対応した漢字手書き文字入力技術を開発――検索率も97.9%

2006年04月24日 20時19分更新

文● 編集部

  • この記事をはてなブックマークに追加
  • 本文印刷

(株)富士通研究所は24日、約8万2000字を認識して手書き入力できる漢字手書き入力技術を開発したと発表した。筆順や続け書きなどの制限がほぼないのが特徴。

部分入力による漢字検索例
部分入力による漢字検索例

開発した技術は、“文字フォントデータからの手書き認識合成技術”と“部分パターン検索技術”の2つ。

“文字フォントデータからの手書き認識合成技術”は、既存の文字フォントからOCR技術により文字を分解し、構成する部品と構造データ(位置関係)を半自動的に抽出。手書きデータは、部品についてのみ収集し、最終的な字形データを部品と構造データから合成する技術。これにより収集しなければならない手書きデータを約40分の1に削減できたという。

“部分パターン検索技術”は、入力された筆画と、認識辞書にある筆画列との対応の類似度を独自の手法を利用して高速で計算する技術。これにより筆順が異なったり、続け書きで入力したりした場合でも類似した漢字を検索し、類似度順に提示可能になったという。

手書き部分入力に対する検索上位候補10個
手書き部分入力に対する検索上位候補10個

実験では、全画数を筆記した場合の検索率(上位30候補に正解が含まれる率)が97.9%、全画数の6割を筆記した場合でも58%と高い精度が得られたとしており、検索時間もPentium 4-1.7GHz搭載機種で1文字あたり約0.8秒と高速で処理できたという。

開発した技術を利用すれば、官公庁など漢字を扱うオフィスでの文字入力業務のコストを大幅に低減できるほか、語彙の多い電子漢字辞書の漢字検索や、中国語入力などにも応用できるとしている。同社では今年度、自治体向け戸籍システムや、汎用日本語入力ソリューションパッケージに搭載する予定という。

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン