凸版印刷は11月11日、明治期から昭和初期(近代)の手書き文字に対応したAI-OCRを開発したことを発表した。
本AI-OCRは、現在凸版印刷が古文書解読とくずし字資料の利活用サービス「ふみのは」として提供している江戸時代のくずし字を対象としたAI-OCRをもとに、近代の多様な筆跡の手書き文字にまで対応の範囲を拡張させたもの。神戸大学経済経営研究所附属企業資料総合センター、三井文庫との共同研究のもと、学術研究や業務の効率化をはかるため開発した。
近代の手書き文字には、書き手によるくずし方のバラつきが大きい、筆記用具の多様化、カタカナ語が混在、旧字旧仮名遣い表記などの特性があり解読が非常に困難とされている。本AI-OCRでは、様々なパターンの文字をAIに学習させることで、これらの難読文字の解読を実現した。
今回開発したAI-OCRは、地方自治体、教育研究機関、企業などが所蔵する難読資料の解読補助や、難読資料の利活用を目的とした検索機能付きデータベースの構築補助、謄本類など日常的に難読資料の解読が必要な企業・機関の作業補助といった利活用のシーンが想定されている。
今後、神戸大学経済経営研究所附属企業資料総合センターの実証実験を11月より実施し、2023年4月より正式サービス開始を予定している。古文書解読スマホアプリ(開発中)の追加サービス、API形式での提供も順次リリース予定としている。