テクノロジーで「無理だ」と言われている場所に行く
99.6%で満足するか、テクノロジーで100%を目指すか。AI OCRの限界を打ち破ったエンジニア社長の気概
2026年04月24日 09時00分更新
99.6%という精度に甘んじることなく、100%のAI OCRを目指す。99.999%(ファイブナイン)という驚異的な精度を実現したAI InsideのDX Suiteの開発背景にあったのは、ひたすらテクノロジーの可能性を信じるエンジニアの気概があった。
ソフトウェア協会は、2026年2月、エンジニアの好奇心・探究心を再燃させるイベント「Tech Challenge Party」を開催。登壇したAI Insideの代表取締役社長CEOの渡久地 択氏は「精度99.9%を実現したAI OCR 独自開発LLMとAI活用のこれから」というタイトルで、AI OCRの精度向上に取り組んだ開発ポリシーについて語った。
「東大入試に受かるくらい大学生」の1万倍の性能を持ったAIが登場
2015年創業のAI Insideは、AIプロダクトの開発を手がける。2017年から展開しているAI-OCRサービス「DX Suite」は高精度な読み取り機能が評価され、国内で高いシェアを誇っている。そのほかにもGPUハードウェア搭載のハードウェア「Cube」、独自開発のLLM「PolySphere/Leapnet」、プライベートタイムのGUI「Mee+」という4つの製品を展開し、AIによる汎用的な課題解決に寄与している。
登壇した代表取締役社長のCEOの渡久地 択氏は、「エンジニアリングとはなにか?」という深遠な問いに対して、「『無理だ』と言われている場所に行く」ことだと定義する。そのアプローチの1つとして、AIという選択肢を選んだAI Inside。渡久地氏はここ数年講演してきた「AGIはいつ来るか?」というトピックから講演をスタートさせる。
渡久地氏がまず紹介したのが「Situational Awareness:The Decade Ahead」という論考だ。これはOpen AIのガードレール作成チームに所属していたエンジニアが退職後の2024年に公開したもので、それ以前の2020年から4年の進化を踏まえ、GPT4からAGIへの道のりが書かれている。
ここでAIが進化するキーファクターとして挙げられているのが「計算リソース」「アルゴリズム」「データの量と質」の3つだ。これらが向上すれば、AIの性能も上がっていくという。
2020年当時から比較すると、まず計算リソースは約100倍向上している。「これはデータセンターが100倍作られるようになっただけでなく、既存のデータセンターや半導体がAIに利用されるようになったことで、100倍になっている」(渡久地氏)。次のアルゴリズムも1年で3~4倍程度向上しているため、こちらも4年で100倍程度の伸びを示している。「単純なかけ算をすると、4年で1万倍のAIを利用できることになる」と渡久地氏。そして2026年にはネット上のデータはすべてAIに取り込まれると言われている。
この結果として、恐ろしいスピードでAIの進化が進んでいるのはご存じの通り。「2024年のAIの精度は『東大入試に受かるくらい』だったが、今年出てくるのは『大学生の1万倍の性能を持つ』AIになる。来年には10万倍の性能が出てくるので、もはや人間の叡智を超える。このAIが世界の課題を解決していくことになる」と渡久地氏は語る。
こうなると、もはやAIは単なる計算機ではなく、国家の主権や文化、経済安全保障を左右する基盤で、文化的なインフラ、情報空間のコントロール、国家の基幹システムへのなってくる。防衛や医療、金融など国家の重要分野でAIに依存するため、それが脆弱性ともなってくる。これが現在のAIを取り巻く、最新の環境だ。
精度の高いAI OCRが壊したのは「データ入力は人がやるもの」という常識
こうしたAIの進化を前提にして、AI InsideはDX Suiteでなにをやってきたか? AI OCRの精度が上がることで、ビジネスがどう変わってきたのか? 渡久地氏はこれまでの取り組みを披露する。
DX Suiteが登場する前、ビジネスプロセスアウトソーシング(BPO)の業界では、データを人間が入力していた。「同じ保険の申込書を2人が入力し、それらを突合して、誤りがないかを調べていた。その上で、3人目がデータチェックを行なう。3人がかりでデータ入力をやっていたので、けっこうコストがかかっていた」と渡久地氏は語る。
しかし、DX SuiteのようなAI OCRの登場により、データ入力はAIが担うようになり、人手はデータチェックの担当だけで済むようになる。この過程で、DX Suiteが“壊したもの”は果たしてなんだったのか? 「『文字が読めるAIが誕生した』とか、『紙がなくなった』という話ではなく、『データ入力は人でなければできないという常識』だったのではないか」と渡久地氏は聴衆に問いかける。
とはいえ、当時のAI OCRで読み込むのが難しい書類もあった。書式が決めっているようで、実は多種多様なフォーマットを採用する財務諸表や形式の決まっていない請求書、あるいは手書きが混じる整形される前の原戸籍、タイムカードなどの非定型のフォーマットだ。AI Insideは2019年に、これら多様で非定型なフォーマットへの対応をスタートさせた。
自社LLMで非定型フォーマットにチャレンジ 一方でライバルたちは?
2019年当時はまだまだ機械学習がメインであり、非定型フォーマットを無限に学習させ続けるのは限界があった。しかし、AI Insideは自社開発に取り組んでいたLLMで転換点をもたらす。2023年6月、LLMをOCRに本格導入し、非定型フォーマットへの対応を実現。この結果、帳票の型という制約が消え、どんなフォーマットでも読み込める汎用AI OCRが実現したという。
非定型フォーマットへの対応により、人間の代わりにAI OCRが書類を読み込む回数は5億回から、2023年内になんと45億回に急拡大した。「非定型フォーマットのニーズは大きかった。苦労したけど、自前でLLM作って良かったなと思った」と渡久地氏。自社LLMは着実にバージョンアップを重ね、ベンチマークでは非構造化フォーマットでは外資系を上回る性能を実現したという。
その後、2025年10月のバージョンアップにより、実データの読み込みで精度は99.6%まで向上。機能面でも社内データベースと検索・突合したり、入力データをRAGのデータソースに変換したり、ソースコードを生成してアプリケーションに活用したり、さまざまなアップデートが施された。この結果、2023年に45億回だった利用回数は、2025年10月以降、ついに90億回に達する。「非定型だけに絞ると当初から3000倍くらいになっていた」ということで、社内でも大いに盛り上がったという。
では、この間ライバルたちはなにをやっていたのか? 実はAI OCRの精度が頭打ちになった段階で、人間が入力補正するサービスを提供していたという。要はテクノロジーで解決しなかったわけだ。「これはビジネス的にはありだと思うが、AI Insideでは選択しない。牛丼で言うと、『うまい』けど、『遅い』『高い』になる(笑)」と渡久地氏は指摘する。
99.6%であきらめなかったAI Inside テクノロジーを信じて、さらなる高みへ
99.6%という読み取り精度をたたき出したDX Suite。しかし、AI Insideはこれで満足しなかった。「われわれの選択は、テクノロジーで100%を実現すること。100%になったら世界が変わる」と渡久地氏は語る。
100%を目指して導入したのが、読むAIと疑うAIを組み合わせた「Critic Intelligence」という手法。精度99.6%の読むAIを、精度99.86%の疑うAIでチェックするので、両者を組み合わせると99.999%の精度が実現する。牛丼で言うところの「早い」「安い」に加え、「うまい=超高精度」が実現されるわけだ。「人間3人でやっても、この精度は出せない。テクノロジーを信じて作ることが非常に大事だと痛感した」と渡久地氏は語る(関連記事:AI-OCRは完成した ― AI insideがデータ化精度“99.999%”を達成)。
DX Suiteで99.999%の精度を実現して以降、数ヶ月で利用回数は120億回を突破した。「76ヶ月で86億回増えていたのが、ここ4ヶ月で30億回プラスされた。今もこの成長は加速している」と渡久地氏はアピールする。
最後、渡久地氏は、「取り巻く環境は非常に大事だし、半導体やデータセンターなど高尚な話はいろいろあるけど、その手前の話として、テクノロジーで解決するという気概を持って、実用に耐えうるものを作っていく気持ちと行動が大事だと思い、この話を共有させていただいた」とコメント。会場の聴衆に「みなさんもテクノロジーで課題を解決するという気概を持って、世界を変えてもらいたい」とエールを送り、登壇を終えた。
本記事はアフィリエイトプログラムによる収益を得ている場合があります















