NVIDIA转向机架级AI系统设计：从GPU销售迈向AI工厂布局

NVIDIA CEO Jensen Huang在机架级产品展示现场发表主题演讲。图片来源：NVIDIA

NVIDIA正将下一代AI基础设施战略重心转向机架级系统。这意味着，围绕单机GPU规格展开的竞争，正逐步让位于系统级整合能力的比拼。公司的定位也在从芯片销售商，延伸至AI工厂整体基础设施的设计者。作为全球AI半导体产业链中最具影响力的企业之一，NVIDIA此次战略转向，预计也将改变相关供应链的投资逻辑。

NVIDIA表示，将在美国圣何塞举行的GTC 2026主题演讲上，正式发布5类基于统一MGX架构的机架级系统。公司在16日举行的媒体简报会上介绍称，这5类系统包括Vera Rubin NVL72、Grok 3 LPX（LPU机架）、Vera CPU机架、BlueField4 STX存储和Spectrum6 SPX，组合后可构建一套AI超级计算机。

NVIDIA将这套方案定义为“可支撑史上最大规模AI基础设施建设的平台”。上述5类机架系统通过统一的MGX架构整合，并以不同机架分别承担不同负载瓶颈。公司还表示，Rubin一代的7款芯片均已进入量产阶段。

从底层逻辑看，这一战略的核心在于，不再仅从芯片层面应对AI数据中心面临的上下文与解码瓶颈，而是将问题提升到系统层面解决。

在具体方案上，NVIDIA介绍称，将通过收购Grok获得的LPU（语言处理器）技术引入机架系统，并与GPU机架进行物理耦合。LPX机架配备256颗LPU和128GB SRAM，并通过基于SpectrumX的专用互连与Vera Rubin机架相连。两类机架将协同处理AI模型在解码阶段的token计算任务，其中GPU负责注意力计算，LPU则分担FFN（前馈网络）层计算。

NVIDIA称，按照1万亿参数模型测算，该方案可实现每秒500 token的处理能力，并将每百万token成本控制在45美元，整体处理量提升至原来的35倍。LPX机架计划于今年下半年与Vera Rubin同步发布。

韩国存储与设备材料产业链有望同时受益于HBM4和AI工厂扩张

NVIDIA此次披露的架构调整，也将直接影响存储市场。当前，Vera Rubin NVL72为每颗GPU配置288GB HBM4；而LPX主要采用SRAM，因此与HBM并不构成直接替代关系。

在新的机架分工下，GPU机架将更聚焦于高附加值的注意力计算，这也意味着Rubin平台整体HBM4搭载密度将高于上一代。NVIDIA持续提升单颗GPU HBM容量的演进路径，也在Rubin一代得到延续。

业界普遍认为，此次GTC披露的机架级一体化设计，可能成为AI基础设施投资逻辑发生质变的拐点。若机架级整合策略加速普及，市场竞争焦点将从单纯的芯片性能，转向系统集成能力，具备整合优势的供应链参与者更有可能获得更大收益。

对于韩国存储厂商而言，HBM4订单扩大的直接机会正在显现。与此同时，AI工厂扩张带来的电力和设备需求增长，也可能为相关设备材料企业带来带动效应。NVIDIA供应链的受益范围，预计将较以往“单一GPU供给”模式进一步扩大。

TrendForce此前分析称，今年HBM3E向HBM4的转换需求将快速增长。SK hynix继续保持HBM市场份额第一，Samsung Electronics也在为HBM4规模化供货做准备。

Agentic AI升温，CPU需求同步上行

除GPU之外，新的增量需求也在形成。NVIDIA认为，随着基于Agent的AI工作负载持续扩散，代码编译、SQL查询、Python执行等工具调用场景正在显著推高CPU负载。为应对这一变化，公司已将自研CPU“Vera”纳入Rubin平台。

Vera采用针对AI执行场景优化的新核心架构“Olympus Core”，实现每核心内存带宽较x86提升3倍、能效提升2倍、单线程性能提升1.5倍。单套Vera CPU机架搭载256颗Vera CPU、400TB内存以及300TB/s内存带宽。NVIDIA还表示，在Meta的OpenDCPerf基准测试中，Vera较上一代Grace实现了2倍性能提升。

NVIDIA判断，Agentic AI需求的扩大将重塑AI工厂的算力资源结构。公司还将推出Rubin DSX平台，并称其可在相同功耗条件下额外部署30%的AI计算资源。随着AI工厂对运营效率的要求持续提升，数据中心电力与冷却相关设备市场也可能迎来新一轮需求增长。NVIDIA表示，该平台将与200多家数据基础设施合作伙伴共同构建。

Dae-geon Seok d2dg@d-today.co.kr

关键词