【ラスベガス】Dell Technologiesは、AI活用が本格化する企業にとって、トークン消費の増大が新たな経営課題になるとの見方を示した。業務を自律的に処理するエージェントAIの普及を背景に、同社は「トークノミクス」をキーワードとして打ち出し、ワークロードごとに実行基盤を最適化する必要性を訴えた。
同社は19日(現地時間)、米ラスベガスで開催中の「Dell Technologies World 2026(DTW 2026)」2日目基調講演で、企業のAIインフラ戦略を説明した。単にAIを導入する段階から一歩進み、どの業務を、どのモデルで、どの基盤上で動かすのかを見極めることが重要だとした。
◆エージェントAI普及でトークンコストが新たな焦点に
Jeff Clarke氏(Dell Technologies副会長兼COO)は、過去1年でAI市場の重心が大きく変わったと説明した。業務を担うAIエージェントの利用拡大に伴い、企業ではトークンコストが主要な課題として浮上しているという。
AIモデルそのものの単価は下がっている一方で、利用範囲の拡大によってトークン消費量は急増している。こうした構造変化を踏まえ、同氏は「トークノミクス」に注目すべきだと語った。
トークノミクスとは、AI活用に伴うトークン使用量が企業のコスト構造を左右するという考え方を指す。モデル提供側ではトークン当たりのコストやモデル効率が問われ、利用企業側では入出力を含めた全体のトークン消費をどう管理するかが重要になるという。
Clarke氏はこれについて、ストレージやコンピューティングと同じ構図だと説明した。単位当たりのコストが下がるほど利用は広がり、結果として総支出が膨らむ可能性があるためだ。同氏は「単価が下がれば新たな用途が生まれる。このパターンをストレージとコンピューティングで何十年も見てきた」と述べた。
基調講演では、開発者1人が10個のエージェントを使い、1日で10億トークンを消費した事例も紹介した。企業内の一部エンジニアチームが、1カ月分のAI利用枠を短時間で使い切るケースもあるという。
Clarke氏は、こうした事象はシステム障害ではなく、AIエージェントが実業務で有効に機能した結果だと説明した。
そのうえで同社は、すべてのAIワークロードを単一の高性能モデルに集約すべきではないと提言した。業務の性質や機密性、性能要件、コスト構造に応じて、ローカルのワークステーション、オンプレミスのデータセンター、エッジ、クラウドを使い分けるべきだとした。
Clarke氏は「本当の問題は、トークン使用量が増えるかどうかではない。適切なワークロードを適切なインフラで処理しているかどうかだ」と述べた。
同氏は、その具体策として「トークンルーティング」を提示した。業務内容に応じて、どのモデルを、どこで実行するかを振り分ける考え方だ。日常的な要約は小型モデルで処理し、機密性の高い金融分析は社内インフラで実行するといった運用を想定している。
これはコスト削減だけでなく、個人情報保護や規制対応の観点からも重要だという。Clarke氏は「トークンルーティングとトークン管理は、今後のインフラ設計で最も重要な意思決定の一つになる」と語った。
◆データ基盤の整備がトークン効率を左右
Dell Technologiesは、トークンコストを抑えるうえでデータ基盤の整備も重要だと強調した。社内データが整理されていなければ、AIはより多くのトークンを使っても必要な答えを得にくい。一方、データが適切に整備されていれば、小型モデルと少ないトークンでも同等の成果を得られるとしている。
同社は、この課題への対応策として「Dell AI Data Platform」を挙げた。Arthur Lewis氏(Dell Technologiesインフラストラクチャー・ソリューションズ・グループ社長)は、同プラットフォームがトークン効率を高める基盤になるとの見方を示した。
同プラットフォームは、社内に分散したデータをAIが活用できる形に整備し、推論ワークロードで利用できるようにするものだ。構造化データに加え、画像、映像、音声などの非構造化データも扱い、AIモデルが利用可能なデータセットへ変換するという。
Lewis氏はさらに、Dell AI Factory戦略とAIワークステーションソリューションを通じて、フルスタックのAIインフラを設計すべきだと提案した。Dell TechnologiesはDTW 2026で、ストレージ、サーバー、セキュリティ、自動化を含む各種ソリューションも披露した。
Lewis氏は「質の高いデータ基盤は、AIの性能だけでなくトークン効率を高める出発点だ。企業はデータをAIが使える形で準備し、最適なインフラ上で実行できなければならない」と述べた。