NVIDIA正将下一代AI基础设施战略重心转向机架级系统。这意味着,围绕单机GPU规格展开的竞争,正逐步让位于系统级整合能力的比拼。公司的定位也在从芯片销售商,延伸至AI工厂整体基础设施的设计者。作为全球AI半导体产业链中最具影响力的企业之一,NVIDIA此次战略转向,预计也将改变相关供应链的投资逻辑。
NVIDIA表示,将在美国圣何塞举行的GTC 2026主题演讲上,正式发布5类基于统一MGX架构的机架级系统。公司在16日举行的媒体简报会上介绍称,这5类系统包括Vera Rubin NVL72、Grok 3 LPX(LPU机架)、Vera CPU机架、BlueField4 STX存储和Spectrum6 SPX,组合后可构建一套AI超级计算机。
NVIDIA将这套方案定义为“可支撑史上最大规模AI基础设施建设的平台”。上述5类机架系统通过统一的MGX架构整合,并以不同机架分别承担不同负载瓶颈。公司还表示,Rubin一代的7款芯片均已进入量产阶段。
从底层逻辑看,这一战略的核心在于,不再仅从芯片层面应对AI数据中心面临的上下文与解码瓶颈,而是将问题提升到系统层面解决。
在具体方案上,NVIDIA介绍称,将通过收购Grok获得的LPU(语言处理器)技术引入机架系统,并与GPU机架进行物理耦合。LPX机架配备256颗LPU和128GB SRAM,并通过基于SpectrumX的专用互连与Vera Rubin机架相连。两类机架将协同处理AI模型在解码阶段的token计算任务,其中GPU负责注意力计算,LPU则分担FFN(前馈网络)层计算。
NVIDIA称,按照1万亿参数模型测算,该方案可实现每秒500 token的处理能力,并将每百万token成本控制在45美元,整体处理量提升至原来的35倍。LPX机架计划于今年下半年与Vera Rubin同步发布。
韩国存储与设备材料产业链有望同时受益于HBM4和AI工厂扩张
NVIDIA此次披露的架构调整,也将直接影响存储市场。当前,Vera Rubin NVL72为每颗GPU配置288GB HBM4;而LPX主要采用SRAM,因此与HBM并不构成直接替代关系。
在新的机架分工下,GPU机架将更聚焦于高附加值的注意力计算,这也意味着Rubin平台整体HBM4搭载密度将高于上一代。NVIDIA持续提升单颗GPU HBM容量的演进路径,也在Rubin一代得到延续。
业界普遍认为,此次GTC披露的机架级一体化设计,可能成为AI基础设施投资逻辑发生质变的拐点。若机架级整合策略加速普及,市场竞争焦点将从单纯的芯片性能,转向系统集成能力,具备整合优势的供应链参与者更有可能获得更大收益。
对于韩国存储厂商而言,HBM4订单扩大的直接机会正在显现。与此同时,AI工厂扩张带来的电力和设备需求增长,也可能为相关设备材料企业带来带动效应。NVIDIA供应链的受益范围,预计将较以往“单一GPU供给”模式进一步扩大。
TrendForce此前分析称,今年HBM3E向HBM4的转换需求将快速增长。SK hynix继续保持HBM市场份额第一,Samsung Electronics也在为HBM4规模化供货做准备。
Agentic AI升温,CPU需求同步上行
除GPU之外,新的增量需求也在形成。NVIDIA认为,随着基于Agent的AI工作负载持续扩散,代码编译、SQL查询、Python执行等工具调用场景正在显著推高CPU负载。为应对这一变化,公司已将自研CPU“Vera”纳入Rubin平台。
Vera采用针对AI执行场景优化的新核心架构“Olympus Core”,实现每核心内存带宽较x86提升3倍、能效提升2倍、单线程性能提升1.5倍。单套Vera CPU机架搭载256颗Vera CPU、400TB内存以及300TB/s内存带宽。NVIDIA还表示,在Meta的OpenDCPerf基准测试中,Vera较上一代Grace实现了2倍性能提升。
NVIDIA判断,Agentic AI需求的扩大将重塑AI工厂的算力资源结构。公司还将推出Rubin DSX平台,并称其可在相同功耗条件下额外部署30%的AI计算资源。随着AI工厂对运营效率的要求持续提升,数据中心电力与冷却相关设备市场也可能迎来新一轮需求增长。NVIDIA表示,该平台将与200多家数据基础设施合作伙伴共同构建。