写真=Reve AI

エージェント型AIの需要拡大を受け、GPUなど、AIの稼働に必要な計算資源の逼迫が深刻になっている。利用料金の上昇に加え、ピーク時の利用制限や障害の増加も目立ち始めた。

米紙ウォール・ストリート・ジャーナル(WSJ)によると、主要なAIインフラであるGPUの時間単価は2025年秋ごろ以降、大きく上昇している。Anthropicはピーク時間帯の計算資源の利用を制限しており、顧客の反発を招いているという。

巨額の資金をAIインフラに投じてきたとされるOpenAIも、この問題と無縁ではない。WSJは、OpenAIが動画生成AIアプリ「Sora」の提供を停止した背景に、計算資源をコーディングやエンタープライズ向け製品へより多く振り向ける必要があったとの見方があると報じた。

OpenAIのAPI経由のトークン使用量は、2025年10月の毎分60億から、2026年3月末には毎分150億へ増加した。トークンはAIモデルが処理するテキストの基本単位で、計算資源の消費量を測る目安にもなる。

GPU料金の上昇はここにきて加速している。AI特化型クラウドのCoreWeaveは2025年末、価格を20%超引き上げた。小規模顧客には契約期間を1年から3年へ延ばすよう求めているという。データ提供企業Ornnによれば、クラウド各社におけるNVIDIA製GPUのスポット価格はここ数カ月で大きく上昇した。NVIDIAの最新Blackwellチップの時間単価は、2カ月前に比べ48%上昇した。

計算資源の不足は、AI各社のサービス安定性にも直結している。急成長するAnthropicでは、2月中旬以降に障害が相次ぎ、一部顧客が他社モデルへ切り替えるきっかけになったという。

AI業界全体を覆う計算資源不足は、当面の解消が見通しにくい。WSJによると、クラウドインフラ企業VultrのJJ・カードウェルCEOは「5年以上この事業を営んできたが、これほど深刻な容量不足は見たことがない」と語った。

そのうえでカードウェルCEOは、「なぜ設備を増強しないのかという声もあるだろうが、問題はリードタイムがあまりに長いことだ。データセンターの建設には時間がかかり、2026年分まで電力枠も埋まっている」と説明した。

エンジニアでテック投資家のベン・ポラディアンは、「誰もが石油について語るが、いま世界で最も不足しているのはトークンだ」と指摘した。さらに「現在のAIは、冷蔵庫の前でレシピを尋ねるような単純なチャットボットではない。AIは作業を指揮し、より高度になっている」と述べた。

キーワード

#エージェント型AI #AI計算資源 #GPU #OpenAI #Anthropic #NVIDIA #CoreWeave #Vultr
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.