このページの本文へ

グーグルAI、1000ページのPDFを読んで質問に答えられるように 白書レベルなら余裕

2024年08月22日 15時30分更新

文● @sumire_kon

  • この記事をはてなブックマークに追加
  • 本文印刷
Geminiのロゴを写した写真

 グーグルは8月21日、生成AI「Gemini」を使用するための「Google AI Studio」「Gemini API」でアップロード可能なPDFの最大容量を、これまでの300ページから1000ページまたは2GBまでに拡大したと発表した。

 同社でAI Studioなどを担当するLogan Kilpatrick氏によると、テキスト理解と画像理解の両方を利用して、1ページにつき1画像として処理しているという。

 国語辞典や英和辞典といったメジャーな辞書はページ数が多い(1700〜3300ページ程度)ため難しいが、コンパクトサイズの辞書や行政機関、業界団体などが発行する白書などであれば、十分対応可能。ページ数の多いPDFデータを扱う機会の多いユーザーには嬉しいアップデートといえそうだ。

カテゴリートップへ

ピックアップ