(株)データ変換研究所は、画像ファイルからテキストファイルを抽出するソフトウェア『GazoCat』を発売する。
『GazoCat』は、Windows形式のビットマップ(白黒、16色、256色、24bit)ファイルからテキスト情報を抽出するソフトウェア。ビットマップ以外の画像からは、一度ビットマップ形式に変換することでテキスト抽出が可能になる。
担当者によると、同製品は単なるOCRソフトウェアではなく、同社が発売予定のライブラリと組み合わせ、全文検索ツールのフィルタとして機能するなど、システムの部品として機能することが想定されている。
スキャナで取り込んだ元々の画像ファイル。 |
ターミナル上で『GazoCat』を実行した結果。オプションで出力時の文字コードなどを指定することもできる。 |
動作が確認されているディストリビューションはRed Hat LinuxとMIRACLE LINUX。製品は2月18日から出荷される。価格は1CPUライセンスで40万円だが、2月18日から6月30日までは発売記念キャンペーン価格として20万円で販売される。
また、2月18日より、期間限定ですべての機能を利用できる体験版を同社Webサイトからダウンロードすることが可能になる。