写真=NVIDIA

NVIDIAの次世代AI推論アクセラレーター「Rubin CPX」を巡り、搭載メモリをGDDR7から高帯域幅メモリ(HBM)へ切り替えるとの見方が市場で浮上している。実際に方針転換があれば、SK hynixやSamsung ElectronicsのHBM需要見通しにも影響しかねず、半導体業界の関心を集めている。

背景にあるのは、AI推論需要の急拡大だ。業界では、大規模な運用環境ではプレフィル処理であっても高いメモリ帯域と容量が求められ、GDDR7では性能効率が不足する可能性があるとの指摘が出ている。Rubin CPXは、AI推論ワークロードのうち、比較的メモリ使用量が少ないプレフィル処理を担う設計とされてきた。

Rubin CPXは当初、HBMではなくGDDR7を採用し、推論コストをBlackwell比で10分の1に抑える戦略製品とみられていた。ただ、GDDR7の容量制約や立ち上がり時の需給不安が、コンシューマー向けグラフィックスカード市場だけでなくデータセンター分野にも波及しかねないとの見方が広がり、最終的にはHBMに回帰するのではないかとの観測につながっている。

こうした見方を後押ししたのが、NVIDIAの第4四半期決算説明会で示された推論需要の強さだ。25日(現地時間)のカンファレンスコールでジェンスン・フアンCEOは、「計算能力がそのまま売上につながる(compute equals revenues)」と述べ、エージェンティックAIへの移行がトークン需要を押し上げているとの認識を示した。

NVIDIAの第4四半期のデータセンター売上高は620億ドルと、前年同期比75%増加した。通期では1940億ドルに達し、2023年のChatGPT登場以降で約13倍に拡大したという。

一方で、推論ワークロードの膨張はメモリ容量への要求も押し上げている。フアンCEOは、エージェンティックシステムが多数のエージェントを同時に生成することで、トークン生成量が急増していると説明した。

さらに、Anthropicの「Claude Cowork」とOpenAIの「Codex」を例に挙げ、「実用的な知能(useful intelligence)」の段階に達したと指摘。コンピューティング能力の確保は一段と重要になっているとした。コレット・クレスCFOも、先端アーキテクチャの供給不足は続くとの見通しを示した。

◆GTCでRubinのロードマップ公表へ、HBM需給の方向性に注目

推論市場の拡大ペースは速く、HBM需給を左右する新たな変数として注目されている。フアンCEOによると、MetaとAnthropicは「数百万台規模のBlackwellおよびRubin GPU」を導入中だという。

NVIDIAはAnthropicに100億ドルを投資する方針だ。クレスCFOは、2026年の上位5社のクラウド事業者による設備投資(CapEx)見通しが年初時点から約1200億ドル上振れし、7000億ドル近くに達するとの見方を明らかにした。

こうした環境が、「Rubin CPXのHBM回帰観測」の背景にある。MicronがGDDR7の容量が性能上のボトルネックになり得ると指摘したほか、GDDR7の初期需給の不安定さを受け、NVIDIAのコンシューマー向けグラフィックスカード「RTX 50 SUPER」シリーズなどの投入遅延を懸念する声も出ている。

コンシューマー市場で表面化したGDDR7の供給不安が、データセンター分野にも波及するとの見方が広がり、HBM回帰観測を強める格好となった。

もっとも、GDDR7からHBMへの切り替えは単純な部品変更では済まない。HBMにはシリコン貫通電極(TSV)技術と2.5DパッケージングのCoWoSが不可欠とされる一方、Rubin CPXはそれらを使わず、標準PCB基板の活用によってコストを抑える設計とみられているためだ。メモリを変更するとなれば、実質的にはチップの再設計を伴う可能性が高い。

最大の焦点は、Rubin CPXのGDDR7戦略が大規模推論環境で求められるメモリ需要を十分に満たせるかどうかにある。HBM回帰観測はなお市場の推測の域を出ないが、128GBのGDDR7でエージェンティックAIの性能要件を支えられるかはなお不透明だ。

NVIDIAは3月16日、サンノゼで開催するGTCの基調講演でRubinプラットフォームの具体的なロードマップを公表する予定。HBM需給見通しの方向性も、このタイミングでより明確になりそうだ。

キーワード

#NVIDIA #Rubin CPX #HBM #GDDR7 #GTC #データセンター #AI推論 #SK hynix #Samsung Electronics
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.