富士通(株)は5日、OCRソフト『表OCR for Excel V4.0』と『文書OCR for Word V.40』を発表した。同社と富士通ミドルウェア(株)が、同日付けで販売を開始する。店頭販売は7月12日に開始する。価格は、両製品とも1万2800円。なお同製品は、同社と(株)富士通インフォソフトテクノロジが共同開発したもの。
『表OCR for Excel V4.0』『文書OCR for Word V.40』 |
同製品は、表計算ソフト『Excel 97/2000/2002』、およびワープロソフト『Word 97/98/2000/2002』のアドインソフトとして利用するOCRソフト。スキャナーなどで取り込んだ原稿から、表や文章の罫線、文字、数値、図などを認識結果をWordやExcelのデータに変換できる。
特徴的な機能として、読みとった原稿と認識結果を同一ウィンドウ内に表示する“重ね表示”機能や、認識結果を音声で読み上げる“読み上げ”機能、また誤認識した文字を修正したあとで辞書登録を行ない、認識結果内の同じ誤認識を一括して修正できる“同一誤字修正”機能などを搭載している。
重ね表示機能は、元原稿と認識結果の差分を効率良く行なえ、読み上げ機能は、数値などの認識結果の検証に役立つという。
傾いた画像を平面画像に補整できる“透視歪み補正” |
(株)富士通研究所が開発した、デジタルカメラで撮影した画像を補正する技術を搭載しており、レンズの影響による歪みを補正する“樽型歪み補正”機能や、斜め方向から撮影した場合の傾きや歪みを補正する“平面透視補正”機能を備える。また、厚手の本を開いた状態などの曲面を補正する“曲面透視補正”機能も搭載している。これらの機能により、スキャナーで読み取りにくい、厚手の本などのからの情報の取り込みもスムーズに行なえるとしている。
操作方法をガイドするムービーも搭載している |
このほか、外字やJIS第3水準の漢字、絵文字など、従来のOCRソフトでは認識できなかった文字も、修正時に辞書登録を行なえば認識できるようになる。ワープロなどで用いる、横倍角文字や半角漢字の認識も行なえる。通常は図と認識してしまう新聞などの見出し文字も自動検出できるようになっている。初心者向けに、操作手順をガイドするムービーも収録している。
対応OSは、Windows 95/98/Me/NT 4.0/2000/XP。動作環境は、Pentium-166MHz以上、メモリー64MB以上、HDDの空き容量100MB以上が必要。表OCR for Excel V4.0の動作には『Excel 97/2000/2002』のいずれかが、文書OCR for Word V4.0の動作には『Word 97/98/2000/2002』のいずれかが必要。スキャナーはTWAIN対応スキャナーに対応する。なお、デジタルカメラ画像の認識を行なう際には、211万画素以上(334万画素推奨)のCCDを搭載したデジタルカメラが必要。同社の広報では「211万画素以下のCCDを搭載したデジタルカメラの画像でも認識は行なえるが、認識精度が低下する可能性がある」としている。
同社では、発売より1年間で、両製品を合わせて2万5000本の売り上げを見込んでいる。