图片来源:NVIDIA

市场消息称,NVIDIA正在评估其下一代AI推理加速器Rubin CPX的内存方案,原本传出的GDDR7配置,现阶段不排除改用高带宽内存(HBM)的可能。若最终采用HBM,SK hynix与Samsung Electronics相关HBM供需预期或将被重新评估,这也令半导体产业链高度关注。

业内普遍认为,在大规模AI推理场景下,即便是prefill阶段,对内存带宽和容量的要求也在明显提高。Rubin CPX原本被视为面向推理场景、用于承担内存压力相对较低任务的产品,因此NVIDIA此前传出拟采用GDDR7而非HBM,意在将推理成本压低至Blackwell的十分之一。不过,随着市场对GDDR7容量上限以及初期供应稳定性的担忧升温,外界对于Rubin CPX改用HBM的预期也在增强。

这一判断的重要背景,是NVIDIA在最新业绩电话会上再次强调推理需求正在快速增长。在当地时间25日举行的电话会上,NVIDIA CEO Jensen Huang表示,“算力即营收(compute equals revenues)”,并称Agentic AI的兴起正持续推高token需求。财报显示,NVIDIA第四季度数据中心业务收入达到620亿美元,同比增长75%;按全年计算,收入为1940亿美元,较2023年ChatGPT问世后大约增长13倍。

与此同时,推理负载的扩大也在同步提升对内存容量的要求。Jensen Huang表示,Agentic系统会同时生成多个代理,带动token生成量迅速上升。他以Anthropic的Claude和OpenAI Codex为例称,相关应用已经达到“有用智能(useful intelligence)”阶段,算力供给的紧迫性也因此进一步上升。NVIDIA CFO Colette Kress则表示,“先进产品的供应短缺将持续”。

GTC或成Rubin路线图关键观察窗口

推理市场增速,被视为影响HBM供需预期的关键变量之一。Jensen Huang表示,Meta与Anthropic正在部署“数百万颗Blackwell及Rubin GPU”。与此同时,NVIDIA还计划向Anthropic投资100亿美元。Colette Kress则透露,2026年全球前五大云服务商的资本开支预测,较年初上调约1200亿美元,总规模已接近7000亿美元。

在这一背景下,关于“Rubin CPX改用HBM”的市场传闻持续发酵。近期,Micron提到GDDR7容量可能成为性能瓶颈。与此同时,GDDR7在初期供应上的不确定性,也引发市场对NVIDIA消费级显卡新品发布节奏的担忧,其中包括RTX 50 SUPER系列等产品。随着这类担忧从消费级市场延伸至数据中心市场,外界对于Rubin CPX转向HBM的预期进一步升温。

不过,从技术路径来看,Rubin CPX若由GDDR7改为HBM,并非简单更换内存器件。HBM需要依赖硅通孔(TSV)技术以及2.5D封装(CoWoS);而市场消息称,Rubin CPX原本为了控制成本,排除了相关方案,转而采用标准PCB基板。若改用HBM,意味着芯片设计与封装方案都需要重新调整。

目前的关键问题在于,Rubin CPX既有的GDDR7方案,能否在大规模推理场景中满足实际内存需求。业内普遍认为,所谓“改用HBM”目前仍停留在市场猜测阶段,但仅凭128GB GDDR7能否支撑Agentic AI相关负载,仍有待观察。按照计划,NVIDIA将在3月16日于圣何塞举行的GTC主题演讲中披露Rubin平台的具体路线图,届时HBM供需预期的走向也有望变得更加清晰。

关键词

#NVIDIA #Rubin CPX #HBM #GDDR7 #AI推理 #数据中心 #SK hynix #Samsung Electronics #CoWoS #GTC
版权所有 © DigitalToday。未经授权禁止转载或传播。