国立国会図書館は2月24日、日本語の活字に対応したPC向けOCRツール「NDLOCR-Lite」を公開した。
NDLOCR-Liteは、書籍の画像からテキストデータを抽出する「OCR」機能をもったツール。先に公開されていた「NDLOCR」の軽量版として開発されたもので、GPU非搭載のノートPCでも動作するのが特徴だ。
対応OSはWindows 、macOS、Linuxで、コマンドライン環境(CUI)だけでなく、各OS向けのアプリからマウス操作で利用することもできる。
2月24日現在の動作確認済み環境(アプリ版)は、以下のとおり。
●動作確認済み環境
■Windows
・Windows 11
■macOS
OSバージョン
・macOS Sequoia
ハードウェア
・Apple M4チップ搭載Mac
■Linux
・Ubuntu 22.04
アプリはNDLラボ公式GitHubからダウンロード可能だ。







