このページの本文へ

前へ 1 2 次へ

「AIエージェントは一人の人間のように考え、扱うべき」その理由とは

「生成AIの登場は“大きな贈り物”だった」 Box CTOが語るAIエージェント戦略

2025年04月08日 09時00分更新

文● 大塚昭彦/TECH.ASCII.jp 写真● 曽根田元

  • この記事をはてなブックマークに追加
  • 本文印刷

 「生成AIの登場は、Boxにとって“大きな贈り物”でした」

 「インテリジェントコンテンツクラウド」を掲げ、“コンテンツ+AI”による高度なワークフロー自動化を推進する現在のBox。同社が「第3章」と呼ぶ新たなステージに進んだ背景には、現在進行中の、生成AIやAIエージェントの急速な技術進化がある。

 あらゆる大手ITベンダー(特にSaaSベンダー)がAIエージェント機能を取り込む動きを見せる中、AIはBoxにどんなインパクトを与えているのか。東京を訪れたBoxのCTO、ベン・クス氏に詳しく話を聞いた。

Box CTOのベン・クス(Ben Kus)氏

「ドキュメントの内容を理解」できる生成AIの登場がBoxを変えた

――ここ数年間のBoxは、AI関連のプロダクトに注力しています。あらためて、生成AIの登場はBoxにどんなインパクトを与えましたか。

クス氏:生成AIの非常に優れた点のひとつが「非構造化データを理解する力」です。

 エンタープライズITの世界では、これまでおよそ20年間にわたって「データ活用の進化」が大きなテーマでした。たとえば、企業が持つデータに基づいてトレンド分析を行ったり、機械学習に利用したり、といったことです。

 ただし、そこで活用されるデータのほとんどは「構造化データ」でした。ドキュメントや画像、ビデオといったコンテンツ、つまり「非構造化データ」は、人間でなければ内容が理解できなかったからです。「企業が保有するデータの9割は非構造化データ」だと言われますが、それらを活用するのは困難だったのです。

 その状況が一変したのが、OpenAIから最初の生成AIモデルが発表されたときです。生成AIは、コンテンツ=非構造化データの内容を理解できたからです。

 非構造化データを扱うBoxにとって、生成AIの登場は“大きな贈り物”になりました。われわれのお客様からも、生成AIが業務に与えた変化として「非構造化コンテンツをうまく活用できるようになった」という話はよく聞きます。

 生成AIの登場が与えたインパクトとして、多くの人は、人間のようにコンテンツが「生成できる」点に注目しがちです。しかし、実はコンテンツの内容が「理解できる」点も重要だったのです。

――OpenAIが「ChatGPT」をリリースしたのは2022年末ですが、Boxではその半年後(2023年5月)に最初の「Box AI」を発表しています(コンテンツの内容について質問回答できるAIアシスタント機能)。かなり早い動きだと思いますが、それ以前から生成AIに注目していたのでしょうか。

クス氏:われわれは、実は7年ほど前から、機械学習モデルを使ってコンテンツ(非構造化データ)を構造化データにしようと試みていました。そうした技術は戦略的に重要だと考えていたからです。

 ただし、当時の技術では、コンテンツの種類に合わせて機械学習モデルを使い分ける必要がありました。たとえば契約書、請求書、音声、ビデオなど、それぞれに特化した機械学習モデルがあるわけです。実際にはモデルの種類が多すぎて、とても使いづらいシステムでした。

 だからこそ、生成AIモデルの登場は、Boxにとって“大きな贈り物”になったのです。生成AIモデルは、1つのモデルだけでほとんどすべてのコンテンツを理解できますからね。

 もうひとつ、AIの組み込みに早期から取り組んで来た理由として、Boxの共同創業者であるアーロン・レヴィ(Aaron Levie、現CEO)やディラン・スミス(Dylan Smith、現CFO)が、AIに強い興味を持っていることも挙げられます。彼らとよく話をしますが、「仮にいま起業するならば、やはり“AIファースト”でサービスを開発するだろう」といつも言っています。

AIエージェントは「人間の同僚と一緒に働く」のと同じように考えるべき

――2023年に発表したBox AIはAIアシスタントでしたが、2024年は「Box AI Studio」など、AIエージェントの世界へと取り組みを進化させました。

「Box AI Studio」は自社の業務向けにカスタマイズしたAIエージェントを作成できる(Box説明会資料より

Box AI StudioによるAIエージェント作成例(Box説明会資料より

クス氏:時代のトレンドは「AIモデル(LLM)」から「AIアシスタント」へ、そして「AIエージェント」へと動いています。

 これを人間にたとえてみましょう。あなたの会社に、とても賢く、とてもよく働く人がいるとします。その人は、わたしや同僚の質問にはすぐに答えてくれますが、それ以外の仕事をすることは許されていない――。われわれは今まで、AIをこのような存在として扱ってきたのです。

 もしも相手が人間ならば、そんなふうには扱わないですよね。いろいろな業務タスクを依頼するでしょうし、相手も指示が不明瞭ならば「どういう意味ですか?」と聞き返してくるでしょう。出てきた答えや結果をレビューして「もっとこんなふうにしてください」と改善を求め、より良いものにしようとするはずです。AIエージェントと「一緒に働く」というのは、そういうことです。

 なので、AIエージェントに仕事をさせる際には、それをテクノロジーの一種だとは考えず「人間のように」扱ったほうがうまくいく気がします。

――なるほど。それならば、人間の同僚のように、何か作業をしてもらったらきちんとお礼を言ったほうがいいですかね?(笑)

クス氏:そうですね、お願いするときも「please」を付けるべきです(笑)。

 将来的には、わたしたち一人ひとりが「複数のAIエージェントで構成されたチーム」を持ち、そのチームと協力しながら仕事をするかたちになるでしょう。それにより、さらに複雑な業務がこなせるようになります。人間があまりやりたくないタスクはエージェントに任せれば、人間がやるべき価値の高いタスクに集中して時間を割けます。

それぞれに強みを持つAIエージェントが協力し合うエコシステムへ

――現在、大手SaaSベンダーがこぞってAIエージェント機能を搭載し始めています。そうした市場の中で、Boxの優位性や強みはどこにあると考えていますか。

クス氏:わたしは、SaaSベンダーがそれぞれの強みにフォーカスしてAIエージェントを提供し、そのエージェントどうしが連携する「エージェントのエコシステム」を形成するようになると考えています。

 Boxが搭載するAIエージェントならば、やはり(Boxに格納されているコンテンツの)非構造化データを参照し、それを分析、調査、理解して、構造化データを抽出できることが“強み”と言えます。

 ただし、AIエージェントが複雑なタスクを処理していくためには、その企業が保有するさまざまなデータにアクセスしなければなりません。それは、Box上にあるデータだけとは限りません。

 たとえば、顧客情報を扱うタスク処理をしたければ、Salesforce上のAIエージェントに任せたほうが適任でしょう。同じように、従業員の人事情報などを扱うタスクならばWorkdayのAIエージェントに任せます。Boxのエージェントがそうした(ほかのSaaSのエージェントが得意とする)タスクまで処理する必要はなく、むしろ「そうしないほうがいい」はずです。

 そのうえで、わたしたち個々人が持つエージェントが、(各SaaSが提供する)多数のAIエージェントに分担作業(サブタスク)を依頼し、全体を管理する役割を担います。こうした仕組みで、エージェントどうしが協力しながら一つの仕事を進めるようになると予想しています。

――つまり、BoxのAIエージェントも他社のAIエージェントもワンチームとなって、適材適所で働くようなイメージですね。

クス氏:会社組織で働く人が、あらゆる仕事を自分一人でこなすわけではないのと同じです。そういう意味でも、やはりAIエージェントを「一人の人間のように」考え、扱ったほうがうまくいくと思います。

 最近、AnthropicがMCPサーバーに関する技術発表をしたように、エージェントどうしのコミュニケーションを支援する動きが活発化しています。多くのSaaSベンダーでは、将来的には人間のユーザーだけでなく、人間のために働くAIエージェントにもサービスを提供するようになると考えています。

前へ 1 2 次へ

カテゴリートップへ

  • 角川アスキー総合研究所

MSIが変える、未来のクリエイターを育てる教育環境

アスキー・ビジネスセレクション

ピックアップ