このページの本文へ

LINEのCLOVA OCR、国立国会図書館のデジタル化資料のOCRテキストデータ化プロジェクトに採用

2021年07月16日 16時00分更新

文● ASCII

　LINEのAIカンパニーは7月15日、国立国会図書館が保有する247万点、2億2300万枚を超えるデジタル化資料のOCRテキストデータ化プロジェクトに、CLOVA OCRが採用されたことを発表した。

公式リリースより

　同図書館では「ビジョン2021-2025 国立国会図書館のデジタルシフト」の一環として、デジタルで全ての国内出版物が読める未来を目指し、2022年3月までに247万点のデジタル化資料をテキストデータ化する取り組みが行なわれている。

　今回テキストデータ化するデジタル化資料の多くは昭和前期以前の資料であり、レイアウトも複雑なため、学習機能のない既存のOCRでは同プロジェクトに必要な精度に達しないことや、2億2300万枚を超えるデジタル化資料の処理に時間を要する点が課題だった。

　CLOVA OCRは同プロジェクトで要求される項目に最適なOCRモデル（ルビ、割注、割書きといった特殊な文書に関しても人手を介さず読み取りする、等）を、スピーディーかつ高いクオリティーで開発・実現することが可能としている。

■関連サイト

ツイートする

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

AIオススメ記事

2026年07月06日

AI

無料の画像生成AI「Krea 2」が話題　実写もアニメもこなす新勢力
2026年07月20日

AI

AIがBlenderを勝手に操作　3D制作のハードルが一気に下がった
2026年07月20日

AV

ついに会話ができるスマートスピーカーが登場！Gemini対応の実力を試してみた！
2026年07月03日

AI

Fableちゃんに16年分のアニメ感想を読ませたら、“オレ専用”の人生ベスト級アニメを企画してきた
2026年07月09日

Team Leaders

ExcelからAIを呼び出せば、自然言語で数式やエラー原因が解析できてとても便利！　「Claude for Excel」ならここまでできる
2026年07月22日

AI

「Gemini 3.5 Proじゃないの？」　Googleの新AI発表に冷淡な反応も
2026年07月27日

AI

社内WebサービスをAIで開発　完成後に直面した運用の壁
2026年06月08日

AI

寝不足になるほど面白い　ローカルAIと音声合成をつないだら、キャラが普通にしゃべり始めた
2026年05月25日

AI

SDXLの次はこれ？　アニメ特化のローカル画像生成AI、驚きの実力
2026年07月24日

AI

日立、システム開発にAIを全面適用　要件定義で最大240倍の生産性を実証

ピックアップ

sponsored

手ぶらで挑戦できるアプライド豊田店の自作PC組み立てイベントで感動の完成体験を！プロのスタッフによるサポートで初参加でも安心
sponsored
ガバナンスの徹底で安全を担保し、AI活用の促進で目指すのは“トレジャーBox”という成長エンジン

“120TB消失危機”を救ったBox。ゼネラルが挑むグローバルデータ統合の舞台裏
sponsored

好評のViewSonic「モニターアーム」にスタイリッシュなモデルが新登場！アームの動きがスムーズで、机も広く使えてデスクトップ環境が激変した
sponsored
スイッチひとつで背中のS字カーブにフィット！

腰を気にする長時間デスクワーカーのための次世代チェア。理想の座り心地を実現する「LiberNovo Omni Pro」
sponsored
JN-IPS34UQ2-HSC6とJN-IPSC34UQ2-HSC6で比較

曲面（湾曲）ディスプレーってなにがすごいの？一般的な平面モデルとの見え方の違いや曲率（R）の意味、選び方を解説
sponsored
JN-IPS27G120U2 価格.com限定モデルをレビュー

27型4K・120Hzゲーミングディスプレーが破格の3万円切り！PCでもPS5でもSwitch 2でも使えるモデルだけど買っても大丈夫？昇降式多機能スタンドやUSB Typc-C給電は？
sponsored
AIによる運用自動化は、企業が生き残るための必須条件

属人化、人手不足、アラートだらけ　「FortiSOC」が目指す次世代SOC改革
sponsored
ZEFT R65YBの魅力をインタビュー

次世代でも、次々世代でも戦える!?Ryzen 9 9950X3D2＆RTX 5070を搭載するASRock尽くしのド安定ゲーミングPCはクリエイティブな作業もどんとこい
sponsored
仕組みとしてはシンプルだが、業務への効果は絶大

「現場に行くのが当たり前」を変えたアズビルのリモート調整　効果はプライスレス
sponsored
マウスコンピューター「DAIV Z4-A9A01SR-B（Copilot+ PC）」がセール中

【1.14kgの高性能＆軽量モバイル】Ryzen AI 9搭載！そして32GBメモリー標準搭載！注目のノートPCが4万7000円オフ
sponsored
マウスコンピューター「G TUNE FG-A7G80」が大幅割引中

【ゲーミングPCが14万円引き】Ryzen 7 9800X3D＋RTX 5080で4KでのPCゲームプレイも！憧れの1台が視野に入った！
sponsored

USB-Cも120Hzもピボットも。いま欲しい機能が全部入り！色再現が美しい23.8型ディスプレーが新定番になる
sponsored
JN-MD-IPST101WHDをレビュー

2万1980円のタッチ対応10.1型モバイルディスプレー、ワイドHD（1540×720ドット）＆アスペクト比77：36って聞きなじみないけど使いやすいの？
sponsored
ファミチキ「ファミマ味」も実食

ファミチキの次に売れている商品が意外！ファミマ「レジ横」人気トップ3
sponsored
茨城県龍ヶ崎市産のゲーミングPC【MADE IN IBARAKI】

田園風景が広がるSTORMの組み立て工場を見学！プロの早組み（しかも丁寧）とBTO PCならではの特注PCパーツに大興奮
sponsored
ビジネスIT環境が大きく変わる中で、情シスさんの悩みも変化している？

「IT機器が高すぎる」「熟練メンバー不在で分からない」… 情シスさんの“現場の悩み”をエンジニア3人に聞いてみた
sponsored
MSI「MPG CORELIQUID P13 360」レビュー

新型水冷クーラー登場！ケーブル隠蔽構造でデザインもスッキリ、組み立てもラクなこの夏注目のパーツを検証する
sponsored

自作マニア必見！フルモジュラー電源ユニットの配線を100均アイテムを使ってさらにスッキリ＆美しくしてみた！
sponsored
MSI「MPG 341CQR QD-OLED X36」レビュー

有機ELの欠点克服！にじみなし、紫反射なし、最新パネル搭載の34インチモニター、その実力を厳しくチェック
sponsored

「テレビいらない派」のあなたに刺さる！ JMGOのプロジェクターで叶える「テレビレスリビング」の新常識
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！