AIトークン消費10倍でも成果は2倍どまり　Jellyfishが開発実態分析

AIコーディングは導入の有無より、いかに効率的に使うかが問われる段階に入っていることを示した。写真=Shutterstock

企業がAI支出の管理を強めるなか、AIコーディングツールの利用量を増やしても、生産性が比例して伸びるわけではないことが分かった。米エンジニアリング・インテリジェンス企業のJellyfishは、Anthropicの「Claude Code」の利用データを分析し、トークン消費が突出して多い開発者でも、成果の伸びは限定的だったと明らかにした。AI活用は、単純な利用量の拡大から費用対効果を重視する局面へ移りつつある。

米Business Insiderが7日（米国時間）に報じた。Jellyfishが公表した分析によると、上位10%の開発者は中位層に比べてAIトークンの消費量が約10倍に達していた一方、成果の伸びは約2倍にとどまった。

トークンは、AIモデルがテキストや指示を処理する際の単位で、課金の基準にもなる。利用量が増えるほどトークン消費は膨らみ、企業のコスト負担も重くなる。

Jellyfishは今回の結果について、トークン消費を極端に増やす戦略には限界があることを示したものだと分析した。AIの利用量を単純に増やすだけでは、生産性向上に直結しないという見方だ。

JellyfishでAI・リサーチを統括するニコラス・アルコラノ氏は、「企業は開発スピードだけでなく、コスト管理も同時に求めている」と説明した。そのうえで、「CFOがAI利用コストを直接注視し始めている」と述べた。

調査では、AI活用度が高い開発者のClaude Codeの週間利用量は、1人当たり最大2億2500万トークンに達した。これに対し、中位層の平均利用量は約3200万トークンだった。利用量には大きな差がある一方、成果の差は相対的に小さい点が今回の分析の要旨だ。

もっとも、AIコーディングツールの導入自体には生産性を押し上げる効果も確認された。Jellyfishによると、ソフトウェア開発の代表的な指標であるプルリクエストの処理量で比較した場合、AI活用度が高いチームは低いチームを約77%上回った。

焦点は、AIを使うかどうかではなく、どの水準で使うのが最も効率的かに移っている。トークンを無制限に消費するのではなく、費用対効果が最も高くなる水準を見極めて管理する必要があるということだ。

アルコラノ氏は、トークン使用量だけで開発者の生産性を評価する手法にも課題があると指摘した。利用するAIモデルや設定が変われば、トークン消費量そのものが大きく変動し、実際の業務成果を正確に反映しない可能性があるためだ。

同氏は、総トークン消費量よりも「プルリクエスト当たりのコスト」のような成果ベースの指標を重視すべきだと強調した。トークンコストが急増すれば、CFOが懸念を強めるのは避けられず、AI運用費の増加が経営負担につながりかねないとの見方も示した。

業界では、複数のAIエージェントを同時に稼働させ、同じ課題に異なるアプローチで取り組ませる事例も増えている。例えば、5つのAIエージェントがそれぞれ別のコードを生成し、開発者がその中から最適な結果を選ぶといった手法だ。

ただ、この方式は効率向上が見込める半面、コスト増も招きやすい。アルコラノ氏は、人手を直接投入するより安価になる可能性はあるとしつつも、多くの計算結果が実際には使われず、無駄なコストとして積み上がる可能性があると説明した。

Jellyfishは、テック業界におけるAI活用の基準が「多く使うこと」から「効率的に使うこと」へ変わりつつあるとみている。初期にはAI利用量そのものが革新性の象徴と受け止められたが、現在は実際の生産性とコスト効率の両立を示すことが求められているという。

そのため企業の関心は、一部の開発者による過度な利用を促すことよりも、より多くのエンジニアを安定した中位水準の活用へ引き上げることに向かっている。今後のAIコーディングツール競争では、単純な性能だけでなく、費用対効果の面で生産性をどこまで最適化できるかが重要な競争力になりそうだ。

Jinju Hong hongjj@d-today.co.kr

キーワード