このページの本文へ

単一モデルでテキスト情報と座標情報を高精度で同時抽出可能に

OCR使わずテキストと座標情報を抽出　LINE WORKSが新技術「CREPE」を発表

2024年09月27日 16時00分更新

文● ASCII

　LINE WORKSは、2024年9月25日、従来のような複数のOCRモデルを使わず、単一モデルで画像ドキュメントからテキスト情報および座標情報を同時抽出する新技術「CREPE」を開発したことを発表した。同技術に関する論文は、文書解析と認識に関する国際会議「ICDAR2024」にて採択されている。

　従来のOCRでは、さまざまなモデル（検出、認識、解析モデルなど）を組み合わせて段階処理されるため、システムの複雑度が増し、誤差が蓄積され、文書の解析精度が低下するという課題を抱えていた。CREPEでは、単一モデルで情報抽出する「End-to-Endモデル」を採用、画像全体を入力として取り込み、直接的に解析結果を生成するアプローチをとっている。

　End-to-Endモデルでは、複雑なシステムが不要かつ誤差の蓄積を防ぐことができるが、“テキストの座標”を抽出できないという新たな課題が発生する。そこでLINE WORKSは、テキスト情報だけでなくその座標情報も同時に抽出することが可能なCREPEを開発。同技術は、「弱教師あり学習」という手法を採用することで、少ないデータで学習できるように設計されている。

「CREPE」の画像ドキュメント解析の一例、レシート画像（左）から有用な情報を抽出した結果（右）

■「CREPE」の手法
（1）SpecialTokenを導入することでSequenceの中で、画像内のテキストを単語単位で抽出（例：text）
（2）Decoder最終層とLM HeadをSequenceHeadとCoordinateHeadに分離することで、テキストだけではなく座標も推論
（3）CoordinateHeadは単語の終わりを意味するトークンが出る場合にアクティベーションされるので、単語ごとの位置を獲得

「CREPE」の概要図

　LINE WORKSは、「LINE WORKS OCR（AI-OCRサービス）」にCREPEを搭載することで、さまざまなドメインに特化した高精度な解析モデルに適応できるとしている。

■関連サイト

ニュースリリース

ツイートする

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

注目ニュース

アクセスランキング

集計期間：: 2026年03月20日~2026年03月26日

TECH 最新連載・特集一覧

ゆるっと知見を深める楽しい会「TECH.ASCII ゆるっとナイト」

4/22はアスキーの楽しすぎる IT業界交流会に来ない？アスキーの参加費無料イベントでお肉を食べながらゆるっと語ろう！【テーマは「2026年度のIT導入トレンド」】
FIXER Tech Blog - FIXER

「再現は無理と思った」歴史人物は誰？　生成AI動画でテレビ番組に協力、その裏側を語る〔FIXERはたらくひと図鑑〕
FIXER Tech Blog - Cloud

手軽に試せるAWS GenUの罠？放置で数万円溶かさないためのコスト注意点
FIXER Tech Blog - AI/Machine Learning

Figma MCP Server×Claude Codeで、デザイナーと開発者を双方向につなぐ
業務を変えるkintoneユーザー事例

市民の命につながる業務改善　舞鶴市・消防本部が“現場第一”のkintone活用で変えたもの
松本典子の「はじめよう！Azure Logic Apps／Power Automateでノーコード／ローコード」

Power Automateでよくある“条件判定の入れ子（ネスト）地獄”、回避する方法は？
連載：今週の「ざっくり知っておきたいIT業界データ」

エンジニアがAIコーディングに感じるメリットと課題／「数年以内にAIエージェントから深刻な情報漏洩」の予測、対策は？ほか
科学技術振興機構の広報誌「JSTnews」

「透明」なカーボンナノチューブで目視と透視が同時にできるゴーグルを開発
FIXER Tech Blog - Development

700行の動的フォームをリファクタリングし、保守性を劇的に向上させた
シン・IoTの教室：ビジネスに活きるつながるモノの世界

1ミリ秒の壁を越えたら、IoTには何ができるようになるのか？

ASCII.jpからのお知らせ