Coinbaseは、AIのトークン使用量が急増する中でも、用途に応じて低価格モデルに振り分けることで、コストをほぼ増やさずに運用している。ブライアン・アームストロングCEOがX(旧Twitter)への投稿で明らかにした。
Business Insiderが8日(現地時間)に報じた。アームストロング氏は、プロンプトを適切に振り分けることで、費用を一定水準に抑えていると説明した。
こうした発言は、AI業界で再び強まっているコスト効率を巡る議論とも重なる。Opus 4.8やGPT-5.5などの最新モデルは高性能とされる一方、トークン消費が膨らみやすい。AnthropicがOpus 4.7を投入した際にも、一部ユーザーから利用上限を指摘する声が上がっていた。
最新モデルを前面に押し出す流れとは別に、実際のサービス運用では、業務ごとにどのモデルを割り当てるかがコスト管理の重要な要素になっていることを示した格好だ。
アームストロング氏は、今後こうしたコスト構造の見直しがさらに進むとみている。「今後12〜18カ月で、業務の80%は99%安いモデルで実行される」と予測した。
一方で、最新モデルについては、日常的な汎用用途ではなく、高度な推論を要する一部業務に重点的に使われる可能性が高いとした。具体例として、科学的イノベーションやエージェントのオーケストレーションを挙げた。
市場の受け止めは分かれたものの、複数モデルを組み合わせて使う方向性には一定の共感が広がった。ベンチャー投資家のマーク・アンドリーセン氏は「興味深い」と評価した。
Boxのアーロン・レヴィCEOは、提示された数値について「やや極端だ」としながらも、今後のAI活用は高性能な処理と大量処理に二極化する可能性が高いとの見方を示した。高難度の業務は先端モデル、反復的な大規模処理は低価格モデルが担う構図が定着し得るという。
一方、トークン消費をいとわない風潮にも変化が出ている。テック業界の一部ではこれまで、高額なトークン費用や最新モデルの利用量そのものを誇示するような空気が広がっていた。スタートアップ界隈でも、トークン使用を抑えるべきではないとの主張は少なくなかった。
Y Combinatorのゲイリー・タンCEOは創業者に積極的なトークン活用を促しており、スタートアップ創業者のランス・ヤン氏も4月に「トークンを節約するのは愚かだ」と発言していた。
ただ、足元ではコストと業務特性に応じてモデルを使い分ける考え方へと軸足が移りつつある。Glynnの共同創業者トニー・ジェンティルコア氏は、アームストロング氏の見立てを妥当だと評価した。
そのうえで、「技術分野にいる人たちにとっては、すでによく知られた話だ」と述べ、Opusの価格を機械的に外挿して論じるのは金融市場くらいのものだと指摘した。
企業がAIを実サービスに組み込む段階に入るにつれ、最新モデルの性能競争だけでなく、どの業務をどのコスト構造で処理するかが、運用上の重要な変数として浮上している。