据传NVIDIA Rubin CPX或改用HBM，GDDR7方案再添变数

市场消息称，NVIDIA正在评估其下一代AI推理加速器Rubin CPX的内存方案，原本传出的GDDR7配置，现阶段不排除改用高带宽内存（HBM）的可能。若最终采用HBM，SK hynix与Samsung Electronics相关HBM供需预期或将被重新评估，这也令半导体产业链高度关注。

业内普遍认为，在大规模AI推理场景下，即便是prefill阶段，对内存带宽和容量的要求也在明显提高。Rubin CPX原本被视为面向推理场景、用于承担内存压力相对较低任务的产品，因此NVIDIA此前传出拟采用GDDR7而非HBM，意在将推理成本压低至Blackwell的十分之一。不过，随着市场对GDDR7容量上限以及初期供应稳定性的担忧升温，外界对于Rubin CPX改用HBM的预期也在增强。

这一判断的重要背景，是NVIDIA在最新业绩电话会上再次强调推理需求正在快速增长。在当地时间25日举行的电话会上，NVIDIA CEO Jensen Huang表示，“算力即营收（compute equals revenues）”，并称Agentic AI的兴起正持续推高token需求。财报显示，NVIDIA第四季度数据中心业务收入达到620亿美元，同比增长75%；按全年计算，收入为1940亿美元，较2023年ChatGPT问世后大约增长13倍。

与此同时，推理负载的扩大也在同步提升对内存容量的要求。Jensen Huang表示，Agentic系统会同时生成多个代理，带动token生成量迅速上升。他以Anthropic的Claude和OpenAI Codex为例称，相关应用已经达到“有用智能（useful intelligence）”阶段，算力供给的紧迫性也因此进一步上升。NVIDIA CFO Colette Kress则表示，“先进产品的供应短缺将持续”。

GTC或成Rubin路线图关键观察窗口

推理市场增速，被视为影响HBM供需预期的关键变量之一。Jensen Huang表示，Meta与Anthropic正在部署“数百万颗Blackwell及Rubin GPU”。与此同时，NVIDIA还计划向Anthropic投资100亿美元。Colette Kress则透露，2026年全球前五大云服务商的资本开支预测，较年初上调约1200亿美元，总规模已接近7000亿美元。

在这一背景下，关于“Rubin CPX改用HBM”的市场传闻持续发酵。近期，Micron提到GDDR7容量可能成为性能瓶颈。与此同时，GDDR7在初期供应上的不确定性，也引发市场对NVIDIA消费级显卡新品发布节奏的担忧，其中包括RTX 50 SUPER系列等产品。随着这类担忧从消费级市场延伸至数据中心市场，外界对于Rubin CPX转向HBM的预期进一步升温。

不过，从技术路径来看，Rubin CPX若由GDDR7改为HBM，并非简单更换内存器件。HBM需要依赖硅通孔（TSV）技术以及2.5D封装（CoWoS）；而市场消息称，Rubin CPX原本为了控制成本，排除了相关方案，转而采用标准PCB基板。若改用HBM，意味着芯片设计与封装方案都需要重新调整。

目前的关键问题在于，Rubin CPX既有的GDDR7方案，能否在大规模推理场景中满足实际内存需求。业内普遍认为，所谓“改用HBM”目前仍停留在市场猜测阶段，但仅凭128GB GDDR7能否支撑Agentic AI相关负载，仍有待观察。按照计划，NVIDIA将在3月16日于圣何塞举行的GTC主题演讲中披露Rubin平台的具体路线图，届时HBM供需预期的走向也有望变得更加清晰。

Dae-geon Seok d2dg@d-today.co.kr

关键词