このページの本文へ

エー・アイ・ソフト、日本語エンジンを一新したOCRソフト『読んde!!ココVer.8』などを発表

2002年02月01日 15時00分更新

文● 編集部 田口敏之

  • この記事をはてなブックマークに追加
  • 本文印刷

エー・アイ・ソフト(株)は1日、日本語/英語活字OCRソフト『読んde!!ココVer.8』を、22日に発売すると発表した。価格は1万9800円。従来バージョンやバンドル版に対応したアップグレード版も販売する。価格は7500円。

『読んde!!ココVer.8』『読んde!!ココVer.8』

併せて、米ニューソフト社のマルチリンガルOCRソフト『Presto! OCR Pro4.2』をセットにした『読んde!!ココVer.8マルチリンガル OCR Suite』を、22日に発売すると発表した。価格は2万9800円(アップグレード版は1万7500円)。なおPresto!OCR Pro4.2は、単体でも販売する。価格は1万4800円。また、(株)クセロのPDFドキュメント管理支援ソフト『クセロ ePower Lite』とセットにした『読んde!!ココVer.8 ファイリング OCR Suite』を4月5日に発売する。価格は2万4800円(アップグレード版は1万2800円)。

『読んde!!ココVer.8マルチリンガル OCR Suite』『読んde!!ココVer.8マルチリンガル OCR Suite』

読んde!!ココ Ver.8では、認識精度を向上させるために、新日本語OCRエンジンや新機能などを搭載している。“インテリジェント日本語OCRエンジン”は、OCR処理後の日本語処理に、日本語IMEなどで用いられている日本語処理技術“形態素解析”を行なうというもの。従来のバージョンに搭載されていた日本語OCRエンジンと併用して、文脈から判断して文字の認識を行なえるという。英語OCRエンジンには、新しく米ABBYY Software House社製のものを搭載した。下線や取消線が引かれている文字の認識が可能になり、“つぶれ”、“かすれ”、およびイタリック体(斜体文字)の認識精度が向上したという。

上かすれ文字、下つぶれ文字
上がかすれ文字、下がつぶれ文字

認識後の修正に関しては、自動修正機能“インテリジェント先回り修正機能”を備えている。これは、誤認識した文字を修正すると、それ以降の同じ文字の誤認識を自動的に修正する機能。

ココde!!ガイド
ココde!!ガイド

ユーザーの操作を支援する機能としては、初心者向けのインターフェース“ココde!!ガイド”を新たに搭載した。これはユーザーの目的に合わせて、ソフトの操作方法をウィザード形式で誘導するもので、初めてOCRソフトを利用するユーザーでも、解説に従って作業を行なえるようにしている。このほか、大量文書のOCR処理を連続で行なえる“OCRファクトリー機能”、スキャナーから読みとった文書だけでなく、アプリケーションやウェブ上から取り込んだ画像上の文字をテキスト化できる“クリップOCR機能”を搭載する。また、読んde!!ココ専用ウェブサイト“OCR WORLD”内で、OCR活用テクニックなどの解説を提供している“Web Q&A”に、メニューから直接アクセスできる機能も搭載している。

スタイルシート形式による書き出し
スタイルシート形式による書き出し

認識結果の保存形式は、従来よりPDF形式をサポートしているが、今回よりサムネイル付きPDFや、タグ付きPDFを出力できるようになった。HTML形式の出力は、新たにスタイルシート(CSS)をサポートし、元原稿のレイアウト情報をより忠実に再現できるようになっているという。

PDFからの読み取り
PDFファイルからの直接文字認識

従来の製品と同じく、表組み原稿を認識して罫線付きの文書データを出力可能な“表OCR機能”や、名刺専用OCR機能“読んde!!ココ名刺”を標準搭載する。また、Microsoft WordやExcel、Adobe Acrobat、一太郎などのメニューバーにOCR機能をアドインすることができる。従来は1枚ずつしかOCR読み取りができなかったが、今回より複数枚の原稿の取り込みや認識に対応している。Adobe Acrobat 4.0/5.0では、イメージとして保存されているPDFファイルから、直接文字認識を行なえるようになった。認識した文字データは、元のイメージ画像に透明なテキストとして重ね合わせ、文字情報+画像情報のPDFファイルとして保存できるので、PDFファイル内の文字検索も行なえる。さらに、読んde!!ココの認識結果を、各アプリケーションに転送するためのアプリケーションバーも備えている。

アプリケーションバー
アプリケーションバー

読んde!!ココVer.8の動作環境は、対応OSがWindows 95/98/Me/NT4.0 Workstation/2000 Professional/XP、Pentium以上のCPUと、64MB以上のメモリー(Windows XPの場合は128MB以上推奨)、55MB以上のHDDの空き容量と、800×600ドット以上、6万5536色以上の表示が可能なディスプレーが必要となっている。スキャナーはTWAIN/WIA対応、またはプラグイン対応のものを利用できる。

Presto! OCR Pro4.2、クセロePware Lite

Presto! OCR Pro4.2は、米ニューソフトが開発したマルチリンガル対応のOCRソフト。英語、ドイツ語、フランス語、スペイン語、イタリア語、ポルトガル語、オランダ語、スウェーデン語、ノルウェー語、デンマーク語、ポーランド語、フィンランド語、ギリシャ語、エストニア語、チェコ語、ロシア語、ウクライナ語、ブルガリア語の18語に対応し、認識段階で自動的にスペルチェックが働き、誤認識の可能性が高い文字を自動修正するという。また、自動スペルチェック機能は働かないが、このほかの19言語にも対応している。

カラーOCRや表OCRに対応しているほか、DOC形式やRTF形式などの出力に対応し、元原稿のレイアウトを再現できるようになっている。動作環境は、対応OSがWindows 95/98/Me/NT Workstation/2000 Professional/XPで、Pentium以上のCPUと64MB以上のメモリー(Windows XPの場合は128MB以上を推奨)、30GB以上のHDDの空き容量と、解像度800×600ドット以上、6万5536色以上の表示が可能なディスプレーが必要となっている。スキャナーは、TWAIN対応のものを利用できる。

ePower Lite
ePower Liteによる文書管理

クセロ ePower Liteは、(株)クセロのPDFドキュメントの管理支援ツール(ファイリングソフト)。他のアプリケーションで作成したドキュメントやイメージをPDFに変換し、文書データベースとして一元管理を行なえる。TWAIN対応のスキャナーを直接コントロールして、書類を画像ファイルとして取り込むこともできる。

文書データベースには、オリジナルファイルと変換されたPDFファイルの両方が登録される。オリジナルファイルを更新すると、対応するPDFファイルの内容も更新される。文書データベースに登録された複数の文書に対して、全文検索を行なえる。文書はサムネイル表示が可能。これにより、ページの概観を確認しながら、複数の文書から必要なページを抜き出して新しい文書を作成したり、不要ページの削除やページの順番の変更なども行なえる。ページの向きを90度単位で回転することもできる。

動作環境は、対応OSがWindows 95(OSR2以降)/98/Me/NT Workstation/2000 Professional/XPで、Pentium以上のCPUと64MB以上のメモリー(Windows XPの場合は128MB以上を推奨)、30GB以上のHDDの空き容量と、解像度800×600ドット、6万5536色以上の表示が可能なディスプレーが必要となっている。

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン