このページの本文へ

ペーパーレスからデータ活用へ 生成AIが切り拓くドキュメント革命

PDFと対話できるAcrobat AIアシスタント 情報過多のナレッジワーカーを救えるか?

2025年06月16日 09時00分更新

文● 大谷イビサ 編集●ASCII 写真提供●アドビ

  • この記事をはてなブックマークに追加
  • 本文印刷

 PDFとチャットすることで、要約や文書の分析などを可能にする「Acrobat AIアシスタント」。最新のユーザー事例や利活用のアイデア、そして今後の機能強化について米アドビでDocument Cloud プロダクトマーケティングディレクターを務める山本 晶子氏に話を伺った。

米アドビ Document Cloud プロダクトマーケティングディレクター 山本 晶子氏

今のナレッジワーカーは情報過多とリソースの少なさに悩んでいる

大谷:Acrobat AIアシスタントが登場した背景について教えてください。

山本:前提として、今のナレッジワーカーは情報過多とリソースの少なさに悩みを抱えています。あまりにも多くの情報を、少ない人数、少ないコストでさばかなければならない。人は増えないけど、仕事は減らない。労働力不足の日本だけの課題ではありません。だから、少ない時間で必要な情報を理解するのは重要です。

でも、AIのような新しいテクノロジーでも、難しすぎると使えません。だけど、今まで使い慣れているツールから自然に利用できると、心理的安全性を得られます。信頼できるツールを使って、いかに自分の仕事を効率的にやるかで迷っています。マーケターの自分も同じで、宝の山がありすぎて、どうやれば自分のたどり着きたい情報に瞬時にたどり着けるかが課題だと思っています。

大谷:なるほど。こうした課題に対して、Acrobat AIアシスタントでは、どのように応えているのか、教えてもらいますか?

山本:はい。Acrobat AIアシスタントのニーズを大きく分けると、「大量の情報を効率的に理解したい」「得た情報から新しいモノを再構築したい」という2つに分かれます。

前者に関しては、製造業の例がわかりやすいです。たとえば、車を作るときには、いろいろな部門がアイデアや課題を出しあいます。今までは個別にミーティングを行なって理解していました。ただ、これらがドキュメントになっていた場合、全員が全部を読み込むのは大変です。

そこでAIアシスタントの要約機能を使い、ドキュメントの内容を短時間で把握することにしたんです。実際、アメリカやドイツの製造業のR&Dでは、こうやって使っています。

対象のPDFからのみ抽出 契約書の精査はニーズも高い

大谷:必要なドキュメントの内容を短い時間で把握できるわけですね。

山本:過去のドキュメントを再活用したいと考えるお客さまも増えています。たとえば、30年前の契約書をすべて理解したい、分析したいといった声です。こうしたニーズにもAcrobat AIアシスタントは応えられます。

大谷:確かに契約書はわれわれのような素人だとなかなか読み解けないし、おそらく法務関係の方もそれなりに苦労している。そこをAIアシスタントが手伝ってくれるんですね。

山本:たとえば「過去の契約書から支払い条件だけを抽出し、差分のリスト化してください」といったプロンプトを入力すると、差分を洗い出してくれます。

米国の大手製薬会社や保険会社などはM&Aを繰り返しますので、契約書の条項がかなり変わります。次のリニューアルでどのように変更していくかを設計する際に、過去の契約書をAIで精査するという用途は非常にニーズがあります。

大谷:Acrobat AIアシスタントの利用で業界による違いはありますか?

山本:業界の違いはあまりなくて、ドキュメントを多く扱う職種であれば、どこでもこうしたニーズは高いです。マーケティングやPRの分野では、週次のブログやウェビナーのアウトラインなどを作るため、大量の情報をAIで効率的に集められます。もちろん、営業も訪問先の財務情報や市場動向などを調べて、提案書に活用するといった使い方ができます。

しかも、あくまで対象のPDFからだけ抽出するので、余計な情報によるハルシネーションは起こりません。必要な情報を効率的に取り出し、再活用できるのがAcrobat AIアシスタントの価値になります。

AIでの活用を防ぐために、プロテクションをかけるのはありか

大谷:後者の「得た情報から新しいモノを再構築したい」というニーズでの用途はいかがですか?

山本:御社のような出版社での事例がユニークです。本を作る工程では、著者の原稿の編集だけではなく、デザインやレイアウト、キャッチコピーの作成、宣伝など、さまざまな仕事をそれぞれの担当が行なっています。各担当は今まで原稿をPDFの状態ですべて読んでいたのですが、AIアシスタントの導入で要約を得ることができるようになりました。

大谷:確かに全部読むのは時間をとりますしね。

山本:でも、これなら全部読み込まなくてもいいし、自分の仕事に必要な情報はプロンプトから引き出せます。要約には出典も明示されるので、気になったらその部分を読めばいい。この使い方はとても面白いなと思いました。

大谷:冒頭に2つのニーズと言っていましたが、なにかを作り出すためには、やはりリサーチが必要なわけで、両者は表裏一体と言えるかもしれません。

山本:確かにそうですね。たとえば、私のようなマーケターが、毎週のようにAcrobatのブログを書く場合のネタ探しにAIを活用できます。検索エンジンを使ったり、自分の体験から書いてもよいのですが、いろいろなアナリストリサーチやホワイトペーパー、記者の記事をAcrobatに取り込み、AIアシスタントを使って、ブログのドラフトを作ることもできます。AIアシスタントからサジェスチョンを得られる場合は、そのネタを組み替えたり、再考します。情報を収集し、新しいモノを再構築する例と言えるかもしれません。

大谷:その話が出てきたので聞いてみたいのですが、私の知り合いの大学教授が「AIに利用されないよう学生向けの資料にプロテクションをかけるのはおかしい」という話をしていました。要は学生がレポート作成などにAIを使って「ずる」をするからという理由で一部の教授はプロテクションをかけるわけですが、AI前提の世の中になるのに、それはおかしいでしょうというスタンスなんです。アドビさんとしてはここらへん、どうお考えですか?

山本:基本的にはユーザーが決めるべき話だと思っています。私たちがなぜ「印刷させない」「変更をさせない」「パスワードがないと開けない」「閲覧に期限を設ける」といったアクセスコントロールの機能をAcrobatに付けているかというと、やはりユーザーが管理すべきコトだと考えているからです。そういったアクセス権が付与されていないドキュメントに関しては、基本AIで利用されるのが前提という話になります。

今、お話ししてくれた学生さんの例だと、AIを使って資料の要約をコピペしても、レポートとしては不十分でしょう。結局はレポートのためにまとめたり、思考する必要があります。この過程こそ学生がやるべきことですし、本来は楽しいことだと思うんです。AIで手間のかかる作業時間を節約しつつ、得た情報を自ら解釈して、精度を高めていく。これが重要ですし、われわれのようなビジネスパーソンも日常的にやっていることです。

単なるペーパーレスからデータ活用のステージへ 生成AIが原動力

大谷:PDFに関して気になるのは、紙をPDFにしているだけのところも多く、データ活用が進んでいるわけではないという点です。「紙やPDFのようなアナログな手法」と話していた方もいました。今まで要は単にペーパーレスだっただけなんですが、生成AIでようやくデータ活用が進む気がします。

山本:ドキュメントのビジネスを30年以上に渡ってやっていますが、契約書、議事録、マニュアル、プレゼンなど業務のドキュメントってどのビジネスでも核になるものです。もちろん正式なもの、非正式なもの、ファイルフォーマットもいろいろですが、これら非構造化データは全体の8割を占めています。

データベースとして構造化されているデータは検索や利活用も容易ですが、8割を占める非構造化データは今まで活用が難しかったのが正直のところ。とある北米の大手企業は、3年間かけて紙の書類をデータ化したのですが、次はどうするのか聞いたら、「活用したいんだけどね」という答えが返ってきました。要はデジタリゼーションで止まっていたんです。

大谷:それが生成AIの登場で変わってきたと。

山本:もちろん手動でもできたと思うのですが、とてつもない時間と費用がかかります。でも、生成AIの登場でこうした非構造化データの活用に道が開かれました。

多くの企業で情報はドキュメントとして管理されていますし、そのフォーマットとしてもっとも使われているのがPDF。しかもWordでも、PowerPointでも、多くのフォーマットはPDFに変換できます。さまざまなドキュメントをPDFで統合管理し、自らのビジネスに活かすことができると思っています。

大谷:AI時代もPDFが優良資産になるということですね。

山本:PDFは知のコンテナです。何十年にも渡って蓄積されたナレッジが埋め込まれて、どこかに眠っています。アドビはPDFの開発元でもあるので、文書の構造をとてもよく理解しています。PDFはフラットな画像のようなファイルではなく、複数のレイヤーから構成され、圧縮されています。

このPDFにおいてアドビとしてチャレンジしたのがAcrobat AIアシスタントです。アドビはそこから情報を抽出(Extract)するための独自のエンジンを持っています。このエンジンとLLMを組み合わせることで、データの中から価値のある情報を取り出すことができます。APIもあるので、複数のファイルを大量に変換することも可能です。

大谷:なるほど。もともと有用な情報やノウハウは持っていたのに、これを探したり、活用する手段がなかった。AIアシスタントによって、これらを効率よく抽出して、活用できるようになったというがメリットなんですね。

山本:ChatGPTのように知らないことを知るための膨大なナレッジ基盤もありますが、私たちのユニークな点は、あくまで絞り込まれた対象のPDFから情報を得られる点です。

米国の製造業や金融機関は社内のドキュメントを生成AIでナレッジベース化し、独自のLLMを構築しています。自社でしか利活用しないドメイン特化型のLLMです。だから、ドキュメントビジネスを30年やっていて、やっとデジタル活用する機運になったのかもしれません。

大谷:確かにペーパーレスからようやくデータ活用に進めるのかもしれません。

山本:あと、お客さまから言われるのは、ドキュメントコントロールの概念をきちんと持たなければならないという意識が上がってきたことです。たとえば、社員全員がアクセスしてよいドキュメントと、アクセスしてはいけないドキュメントがありますよね。これまであまり意識が向かなかったこうしたドキュメントのアクセスに対して、目が向くようになってきました。

たとえばSharePointでアクセス権を設定しおくとか、AcrobatでPDFにパスワードをかけておくといったルール作り。誰が、どのドキュメントに対して、どの権限で、AIを使えるのか。あるいはLLMに対して、どこまでの情報を出してよいのか。テクノロジーとは観点の異なるルールや決め事作りが今は一番大事と考えられています。

AIアシスタントの価値は単なる時短だけじゃない

大谷:Acrobat AIアシスタントの定数的な導入効果は、やはり業務の効率化や生産性向上になるのですか?

山本:実際にアドビの調査では、今まで6時間かかっていた作業が2時間で済むようになっているので、時給換算したコスト削減はかなり大きいでしょう。ただ、そこは本質でありません。単に時間を短縮するのではなく、本来向き合うべき思考に専念できる。こうした価値を提供するのが、Acrobat AIアシスタントです。

無駄を省き、自分がフォーカスすべきところに集中できる。企業としても、いわゆる作業に時間を費やすより、価値につながる業務に時間を充ててもらった方が投資対効果は高い。AIがすべての作業を代替するのではなく、AIの効率的な情報収集と提案に基づいて、人間が設計やプランを立てることに専念できます。

大谷:2月に日本語版がようやく出たわけですが、遅れた理由や開発の苦労などあれば教えてください。

山本:やはりダブルバイトは難しかったです。PDFからデータを抽出するにあたってシングルバイトとダブルバイトはやはり難易度が違うという点もありますし、お客さまが求める精度も日本は高い。英語版に比べて、日本語対応が遅くなったのも、このダブルバイトの扱いと日本で求められる精度を満たすためという背景があります。

特に日本のお客さまは多言語の文書を翻訳して読むというニーズがあるので、翻訳の正確さも求められます。英語圏では翻訳という用途が発生しないので、その部分では機能として追加している面もあります。

大谷:日本での発表から半年も経っていませんが、国内での導入について教えてください。

山本:まだ「AIはまだユースケースがわからない」とおっしゃるディジョンメーカーの方も多い状況です。もちろん、われわれもいろいろ提案するのですが、最終的にはその会社がなにに一番困っているのかがないと、ユースケースは生まれてきません。そういったユースケースを探すのに、日本でも数社でパイロットプロジェクトを始めています。

まず性能や精度の底上げを重視 今後はAIエンジン統合やエージェントも

大谷:最新バージョンでの強化点や今後の予定について教えてください。

山本:北米でリリースされた当初は、対象のファイルサイズやファイル数に制限がありましたが、これらの制限が少しずつ緩和されています。

あと、地味でありながら、重要な精度(Accuracy)がどんどん向上しています。データの抽出エンジンが正しいデータを取り出せば、LLMで生成される回答も品質が向上します。だから、抽出エンジンの精度とレスポンススピードをつねに向上させています。複雑なテーブルで構成されていたり、段落が画像に挟まれて飛んでいたりといった文書でも、きちんと理解できるようにする。ここは日々チューニングを進めている状態です。

大谷:目新しい新機能を追加するというより、基盤としての精度を高めるという点に注力しているわけですね。

山本:今のところはそうです。ただ、今後はAcrobat AIの新しい機能が増えてくると思います。

ご存じの通り、アドビはクリエイティブ系製品で利用できる「Firefly」という画像系のAIエンジンを持っています。アドビとしては、画像系に強いAIエンジンとAcrobatに搭載されているドキュメントに強いAIをなるべく早く融合していきたいと思っています。

あとは、プロジェクト管理の機能です。たとえば、今回の取材にあたっては、過去に自分が話した内容のまとめだとか、現在北米のトレンドでお伝えしたいこと、あるいはAI関連のトピックなどをノートブックにまとめています。こうしたこともAcrobatのAIで自動化できるように機能を拡充していきたいです。

大谷:Acrobatは複数のPDFをまとめるバインダー機能があります。あれはユーザー自身が任意にファイルを選択し、まさにバインダーにまとめていくわけですが、それをAIエージェント的な機能が勝手にまとめてくれるみたいなイメージですかね。

山本:まだまだコンセプトですが、まさにそういうイメージです。マーケターや営業といった職種やターゲットを設定しておくと、AIが自分に必要なドキュメントをまとめてくれるといった感じ。ただ、Acrobat AIアシスタントのメリットは、あくまで特定の領域で利用できる点なので、利用できるドキュメントを絞った範囲でのAIエージェントを作れるみたいなイメージになると思います。

■関連サイト

カテゴリートップへ