99.6%で満足するか、テクノロジーで100%を目指すか。AI OCRの限界を打ち破ったエンジニア社長の気概

2026年04月24日 09時00分更新

文● 大谷イビサ　編集●ASCII

　99.6％という精度に甘んじることなく、100％のAI OCRを目指す。99.999％（ファイブナイン）という驚異的な精度を実現したAI InsideのDX Suiteの開発背景にあったのは、ひたすらテクノロジーの可能性を信じるエンジニアの気概があった。

　ソフトウェア協会は、2026年2月、エンジニアの好奇心・探究心を再燃させるイベント「Tech Challenge Party」を開催。登壇したAI Insideの代表取締役社長CEOの渡久地択氏は「精度99.9％を実現したAI OCR　独自開発LLMとAI活用のこれから」というタイトルで、AI OCRの精度向上に取り組んだ開発ポリシーについて語った。

AI Inside 代表取締役社長CEO 渡久地択氏

「東大入試に受かるくらい大学生」の1万倍の性能を持ったAIが登場

　2015年創業のAI Insideは、AIプロダクトの開発を手がける。2017年から展開しているAI-OCRサービス「DX Suite」は高精度な読み取り機能が評価され、国内で高いシェアを誇っている。そのほかにもGPUハードウェア搭載のハードウェア「Cube」、独自開発のLLM「PolySphere/Leapnet」、プライベートタイムのGUI「Mee＋」という4つの製品を展開し、AIによる汎用的な課題解決に寄与している。

　登壇した代表取締役社長のCEOの渡久地択氏は、「エンジニアリングとはなにか？」という深遠な問いに対して、「『無理だ』と言われている場所に行く」ことだと定義する。そのアプローチの1つとして、AIという選択肢を選んだAI Inside。渡久地氏はここ数年講演してきた「AGIはいつ来るか？」というトピックから講演をスタートさせる。

「『無理だ』と言われている場所に行く」のがエンジニアリング

　渡久地氏がまず紹介したのが「Situational Awareness:The Decade Ahead」という論考だ。これはOpen AIのガードレール作成チームに所属していたエンジニアが退職後の2024年に公開したもので、それ以前の2020年から4年の進化を踏まえ、GPT4からAGIへの道のりが書かれている。

　ここでAIが進化するキーファクターとして挙げられているのが「計算リソース」「アルゴリズム」「データの量と質」の3つだ。これらが向上すれば、AIの性能も上がっていくという。

　2020年当時から比較すると、まず計算リソースは約100倍向上している。「これはデータセンターが100倍作られるようになっただけでなく、既存のデータセンターや半導体がAIに利用されるようになったことで、100倍になっている」（渡久地氏）。次のアルゴリズムも1年で3～4倍程度向上しているため、こちらも4年で100倍程度の伸びを示している。「単純なかけ算をすると、4年で1万倍のAIを利用できることになる」と渡久地氏。そして2026年にはネット上のデータはすべてAIに取り込まれると言われている。

AIの性能向上をもたらす3つのキーファクター

　この結果として、恐ろしいスピードでAIの進化が進んでいるのはご存じの通り。「2024年のAIの精度は『東大入試に受かるくらい』だったが、今年出てくるのは『大学生の1万倍の性能を持つ』AIになる。来年には10万倍の性能が出てくるので、もはや人間の叡智を超える。このAIが世界の課題を解決していくことになる」と渡久地氏は語る。

　こうなると、もはやAIは単なる計算機ではなく、国家の主権や文化、経済安全保障を左右する基盤で、文化的なインフラ、情報空間のコントロール、国家の基幹システムへのなってくる。防衛や医療、金融など国家の重要分野でAIに依存するため、それが脆弱性ともなってくる。これが現在のAIを取り巻く、最新の環境だ。

精度の高いAI OCRが壊したのは「データ入力は人がやるもの」という常識

　こうしたAIの進化を前提にして、AI InsideはDX Suiteでなにをやってきたか？　AI OCRの精度が上がることで、ビジネスがどう変わってきたのか？　渡久地氏はこれまでの取り組みを披露する。

　DX Suiteが登場する前、ビジネスプロセスアウトソーシング（BPO）の業界では、データを人間が入力していた。「同じ保険の申込書を2人が入力し、それらを突合して、誤りがないかを調べていた。その上で、3人目がデータチェックを行なう。3人がかりでデータ入力をやっていたので、けっこうコストがかかっていた」と渡久地氏は語る。

　しかし、DX SuiteのようなAI OCRの登場により、データ入力はAIが担うようになり、人手はデータチェックの担当だけで済むようになる。この過程で、DX Suiteが“壊したもの”は果たしてなんだったのか？　「『文字が読めるAIが誕生した』とか、『紙がなくなった』という話ではなく、『データ入力は人でなければできないという常識』だったのではないか」と渡久地氏は聴衆に問いかける。

DX Suiteが壊したのは『データ入力は人でなければできないという常識』

　とはいえ、当時のAI OCRで読み込むのが難しい書類もあった。書式が決めっているようで、実は多種多様なフォーマットを採用する財務諸表や形式の決まっていない請求書、あるいは手書きが混じる整形される前の原戸籍、タイムカードなどの非定型のフォーマットだ。AI Insideは2019年に、これら多様で非定型なフォーマットへの対応をスタートさせた。

非定型フォーマットへの対応をスタート

自社LLMで非定型フォーマットにチャレンジ　一方でライバルたちは？

　2019年当時はまだまだ機械学習がメインであり、非定型フォーマットを無限に学習させ続けるのは限界があった。しかし、AI Insideは自社開発に取り組んでいたLLMで転換点をもたらす。2023年6月、LLMをOCRに本格導入し、非定型フォーマットへの対応を実現。この結果、帳票の型という制約が消え、どんなフォーマットでも読み込める汎用AI OCRが実現したという。

　非定型フォーマットへの対応により、人間の代わりにAI OCRが書類を読み込む回数は5億回から、2023年内になんと45億回に急拡大した。「非定型フォーマットのニーズは大きかった。苦労したけど、自前でLLM作って良かったなと思った」と渡久地氏。自社LLMは着実にバージョンアップを重ね、ベンチマークでは非構造化フォーマットでは外資系を上回る性能を実現したという。

　その後、2025年10月のバージョンアップにより、実データの読み込みで精度は99.6％まで向上。機能面でも社内データベースと検索・突合したり、入力データをRAGのデータソースに変換したり、ソースコードを生成してアプリケーションに活用したり、さまざまなアップデートが施された。この結果、2023年に45億回だった利用回数は、2025年10月以降、ついに90億回に達する。「非定型だけに絞ると当初から3000倍くらいになっていた」ということで、社内でも大いに盛り上がったという。

　では、この間ライバルたちはなにをやっていたのか？　実はAI OCRの精度が頭打ちになった段階で、人間が入力補正するサービスを提供していたという。要はテクノロジーで解決しなかったわけだ。「これはビジネス的にはありだと思うが、AI Insideでは選択しない。牛丼で言うと、『うまい』けど、『遅い』『高い』になる（笑）」と渡久地氏は指摘する。

ライバルたちはテクノロジーで解決しなかった

99.6％であきらめなかったAI Inside 　テクノロジーを信じて、さらなる高みへ

　99.6％という読み取り精度をたたき出したDX Suite。しかし、AI Insideはこれで満足しなかった。「われわれの選択は、テクノロジーで100％を実現すること。100％になったら世界が変わる」と渡久地氏は語る。

　100％を目指して導入したのが、読むAIと疑うAIを組み合わせた「Critic Intelligence」という手法。精度99.6％の読むAIを、精度99.86％の疑うAIでチェックするので、両者を組み合わせると99.999％の精度が実現する。牛丼で言うところの「早い」「安い」に加え、「うまい＝超高精度」が実現されるわけだ。「人間3人でやっても、この精度は出せない。テクノロジーを信じて作ることが非常に大事だと痛感した」と渡久地氏は語る（関連記事：AI-OCRは完成した ― AI insideがデータ化精度“99.999%”を達成）。

99.6％に甘んじず、テクノロジーで精度99.999％を達成

　DX Suiteで99.999％の精度を実現して以降、数ヶ月で利用回数は120億回を突破した。「76ヶ月で86億回増えていたのが、ここ4ヶ月で30億回プラスされた。今もこの成長は加速している」と渡久地氏はアピールする。

　最後、渡久地氏は、「取り巻く環境は非常に大事だし、半導体やデータセンターなど高尚な話はいろいろあるけど、その手前の話として、テクノロジーで解決するという気概を持って、実用に耐えうるものを作っていく気持ちと行動が大事だと思い、この話を共有させていただいた」とコメント。会場の聴衆に「みなさんもテクノロジーで課題を解決するという気概を持って、世界を変えてもらいたい」とエールを送り、登壇を終えた。

■関連サイト