このページの本文へ

「人件費がトークンコストに変わる」エージェント時代に備える、Dell Technologies Worldレポート

AI活用企業を悩ませる“トークンコスト”問題 デル・テクノロジーズが示したいくつかの解決策

2026年06月29日 09時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

AIエージェント時代に適合する“AIネイティブ企業”5つの条件

 AIエージェント時代のさまざまな環境変化は、企業のあるべき姿にも大きな影響を及ぼす。クラーク氏は、これからの10年で成功する企業を「AIネイティブ企業」と呼んだ。ただし、この言葉は“AI時代に誕生した新しい企業”を指すものではなく、「歴史ある古い企業であってもAIネイティブ企業への変革は可能だ」と強調した。

 「AIネイティブ企業という言葉は、『AIエージェント時代に適したオペレーティングモデル(事業運用の手法)を備えている企業』という意味だ。あらゆるワークフロー、意思決定、製品、やり取りに、インテリジェンスという道具が浸透していることが前提となる」

 より具体的な「AIネイティブ企業の条件」として、クラーク氏は次の5つを挙げた。

■クラーク氏が挙げた「AIネイティブ企業の条件」
(1)AI Readyなデータ基盤:AIのある場所にデータを移動するのではなく「データのある場所でAIが稼働する」こと
(2)分散AIインフラ:AIトレーニング用の大規模GPUクラスタと、推論用の分散AIインフラの両方を構築すること
(3)セキュアな自律システム:エージェントが安全に操作でき、トラブル時にはロールバックもできる基幹システムを備えること
(4)エンタープライズスタックの統合:エージェントによる操作に対応した、APIファーストのエージェントフレームワークを備えること
(5)エージェントの能力と、トークノミクスを考えた再構築:AIワークロードを処理する場所/インフラ/モデルを一元管理し、最適なパフォーマンス、データプライバシー、コスト効率を実現すること

 このうち、本記事のテーマに大きく関わるのは(5)だ。クラーク氏は、ワークロードの内容や性質に合わせて「適切な階層(エッジ/PC、データセンター、クラウド)」で「適切なモデル」を実行するよう振り分け、トークンコストの最適化を図る“トークンルーティング”という考え方を紹介した。

 たとえば、「ビジネス文書の要約」のような簡単な処理に、最先端のフロンティアモデルやコストの高いAIインフラを使う必要はない。その反対に、複雑に連鎖する推論処理を小規模なモデルやインフラで実行しても、満足のいくパフォーマンスや成果は出せない。トークンコストを抑えつつ最良の成果を得るためには、トークンルーティングが欠かせないというわけだ。

オープンソースのAIエージェント基盤を開発するOpenClaw Fouondationから、共同創設者兼理事会メンバーのデイブ・モリン(Dave Morin)氏もゲスト登壇した

Deskside Agentic AIは“無料で無制限のトークン生成器”

 トークンコストを最適化するためには、クラウドサービスだけでなく、ユーザーのラップトップやデスクサイド、データセンター、エッジにもAI処理環境を展開し、適材適所で使い分ける必要がある。

 Dell Technologies Worldの初日には、デスクサイドで1兆パラメーター級の大規模モデルも実行できるワークステーション「Dell Deskside Agentic AI」や、ハイパースケーラーやAIサービスプロバイダー向けのラックスケールソリューション「Dell PowerRack」などが発表された。

Dell Deskside Agentic AIの旗艦製品「Dell Pro Max with GB300」を紹介

 クラーク氏はDeskside Agentic AIについて、AIエージェントを活用する場合のトークンコストの抑制効果を、クラウドAIサービスのコストと比較しながら示した。

 たとえば、あるAIエージェントが24時間で10億トークンを消費した場合、クラウドサービスのトークンコストは3400ドル(日本円で55万円ほど)に達する。一方、Deskside Agentic AIを導入すれば「このコストがゼロになる。つまり“無料で無制限のトークンジェネレーター”だ」とクラーク氏は強調した。

 むろん、現実には製品の購入コストや電気代などがかかるため「無料」は言いすぎなのだが、企業のトークン消費量が急激に伸び続ける中では、AIインフラを自社導入しても意外と早く投資回収が見込めることに気づかされる。

 なお、Deskside Agentic AI各製品の“トークンジェネレーター”としての性能は、20ペタFLOPSの性能を持つ旗艦製品「Dell Pro Max with GB300」が700トークン/秒、最大5枚のNVIDIA RTX PRO GPUを搭載できる「Dell Pro Precision 9」は400トークン/秒、超小型で1ペタフロップス性能の「Dell Pro Max with GB10」は40トークン/秒だと説明した。これらはすべて「NVIDIA NemoClaw」や「NVIDIA OpenShell」といったソフトウェアスタックをサポートしている。

AIエージェント群が24時間で10億トークンを消費する場合、クラウドでは3400ドルのトークンコストがかかるが、オンプレミスならそれがゼロだと話した

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

  • 角川アスキー総合研究所