9月6日、富士通研究所は社外秘マークや背景の透かし文字などを検出し、情報漏えいを防止する技術を発表した。
従来の情報漏えい対策では、テキスト情報内の「社外秘」などの特定文字列を検出し、機密文書と認識するパターンが一般的であった。しかし、今回富士通研究所が開発したのは、テキスト情報だけではなく、社外秘マークや透かし文字なども検出し、総合的に機密情報かどうかを判断できるというもの。
具体的には、文書に対して仮想的な印刷処理を行なうことで、イメージデータ(EMF:Enhanced Metafile)に変換。このEMFファイルを解析し、文字や画像、図形などを分離したのち、それぞれに最適な文字認識を行なわせる。仮想の印刷イメージを用いるために、アプリケーションに依存しない解析が実現。テキストコードの抽出やページ全体のOCR処理に比べても、検出精度を高めることができるという。
富士通では電子メールの添付ファイルや文書管理システムでの情報漏えい対策での活用を目指し、2011年度の実用化を目指すという。