このページの本文へ

金融機関などの帳票入力ソリューション、日本語手書き文字に「90%台前半」精度で支援

キヤノンMJとコージェントが協業、高精度な「手書きOCR」提供

2017年10月25日 13時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 キヤノンマーケティングジャパン(キヤノンMJ)は10月25日、人工知能(AI)関連スタートアップのCogent Labs(コージェントラボ)との協業による「手書き AI OCRソリューション」を11月から提供すると発表した。キヤノンMJの帳票OCRソリューションにCogent Labsの手書き文字デジタル化サービスを組み込み、日本語/手書きの帳票を高い精度でOCR処理できるようにする。

「手書き AI OCRソリューション」の活用イメージ(保険契約申込書の入力作業におけるOCR適用)

協業ソリューションの概要。キヤノンMJがスキャン画像の最適化や非定型帳票への対応技術、業務システム連携などを、またCogentが手書き日本語OCR技術を提供することで、業務活用しやすい高精度OCRソリューションを実現する

 キヤノンMJではこれまでも、金融機関や保険会社などを主なターゲットとして、定型/非定型帳票に対応したOCRソリューションを提供してきた。同社製のOCRエンジン「RosettaStone-Components」では、帳票スキャン画像をあらかじめ補正したうえで読み取り処理を行うため、高精度なOCR処理ができる点を強みとしている。

 ただし従来の同社ソリューションでは、OCRが読み取れる文字種が活字文字や活字数字、チェックボックス、手書き数字など部分的な対応にとどまっていた。今回は、ここにCogent Labsの手書き文字デジタル化サービス「Tegaki」を組み合わせることで、手書きの漢字やひらがな、カタカナ、英数字や記号にも対応した高精度なOCRソリューションを提供する。

 Tegakiは、数百万とおりの手書き文字データセットをあらかじめ学習したAIエンジンであり、さらに言語モデルを用いて文脈から読み取った文字の誤りを自動修正する能力も備える。Cogent Labsからクラウドサービスとして提供されているが、今回はキヤノンMJが販売代理店契約を締結し、ソリューションに組み込んだかたちで提供する。Tegakiを利用する文字認識処理部分は、月額の従量課金制となる(一定の文字量までは定額)。

Tegakiでは大量の手書き文字から学習したAIエンジンを使用し、さらに言語モデルも併用して読み取った文字の修正も行うことで、高い読み取り精度を実現する

 キヤノンMJの持つOCR用画像の最適化技術とTegakiを組み合わせたことで、実務に使える高精度なOCRソリューションを実現したとしている。キヤノン内でのテストでは、今回のソリューションにおける手書き帳票の文字認識率で「90%台前半」を記録しており、さらにTegakiは再学習能力も備えているため、業務活用が進むのと並行して継続的な認識率の向上が期待できる。

「手書き AI OCRソリューション」の全体像

 さらにキヤノンMJは、OCRソフトウェア部分だけでなく業務用スキャナ、各種ドキュメントシステムや基幹システムとのインテグレーション、BPOサービスやコンサルティングなど、帳票にまつわる業務プロセス全体に対するソリューション/サービスをキヤノングループとして一括提供できる点も強みだと述べている。

 なお、キヤノンMJはSBIインベストメントが運営する「FinTechファンド」に参加(出資)しており、Cogent Labsはその一社にあたる。キヤノンMJでは、今回の協業は同社ドキュメントソリューション分野における「AI分野でのオープンイノベーション第一号」だと述べている。

カテゴリートップへ