“NVIDIA现在已经是一家异构AI基础设施平台公司了。”
知名科技分析师Patrick Moorhead在当地时间16日NVIDIA年度大会GTC 2026结束后,作出了上述判断。
在本届GTC上,NVIDIA发布了全新AI基础设施平台Vera Rubin,并同步推出7款芯片和5类机架系统。Patrick Moorhead认为,这是历届GTC中完成度最高的一次架构发布之一。
Vera Rubin平台的核心是NVL72机架,由Rubin GPU、Vera CPU以及高速互连技术NVLink 6构成。NVIDIA表示,与上一代Blackwell相比,Vera Rubin可将每瓦推理吞吐提升10倍,同时把每token成本降至十分之一。Microsoft CEO Satya Nadella也确认,Azure已经开始运行Vera Rubin。
Patrick Moorhead尤其关注推理芯片公司Groq被纳入NVIDIA体系。NVIDIA此次发布的Groq 3 LPX机架配备256颗LPU处理器,片上SRAM容量为128GB,带宽达640TB/s。CEO Jensen Huang表示,Groq与Vera Rubin结合后,每兆瓦推理吞吐可提升35倍。Samsung Electronics将负责生产LP30芯片,计划于2026年下半年出货。
与此同时,Vera CPU也成为大会焦点之一。Jensen Huang表示:“没想到CPU本身就能卖出这么多,现在基本可以确定,这会是一项数十亿美元规模的业务。”
他解释称,Vera CPU主要面向AI Agent场景。在AI Agent调用工具、编译代码等任务中,相关工作需要由CPU承担;如果CPU速度不足,GPU就会出现停等,Vera CPU正是为缓解这一瓶颈而设计。
Alibaba、ByteDance、Meta和Oracle Cloud将部署Vera CPU,Dell、HPE、Lenovo和Supermicro则负责制造。
除硬件外,NVIDIA的软件布局也在本届GTC上进一步明确。面向AI Factory的开源推理操作系统Dynamo 1.0正式发布。除AWS、Microsoft、Google Cloud和Oracle Cloud等云厂商外,PayPal、Pinterest和ByteDance也已采用该方案。
NVIDIA还发布了NemoClo Stack,为开源AI Agent工具OpenClo增强安全功能。Jensen Huang将OpenClo比作Windows和Mac,称其是“面向个人AI的操作系统,是与HTML、Linux同样重要的创新”。他还表示,Adobe、Atlassian、SAP、Salesforce、ServiceNow、CrowdStrike和Siemens等公司已经开始引入。
与此同时,NVIDIA在Physical AI生态上的推进速度也超出市场预期。ABB、FANUC、KUKA和Yaskawa等工业机器人厂商宣布,将采用NVIDIA Omniverse和Isaac仿真平台。
上述四家公司合计安装的机器人数量已超过200万台。BYD、Geely和Nissan将把NVIDIA DRIVE Hyperion用于L4自动驾驶,Uber则计划自2027年起,将基于NVIDIA的Robotaxi服务扩展至28座城市。
不过,挑战依然存在。Patrick Moorhead表示:“对于非超大规模云厂商的一般企业来说,同时运维5类机架、7款芯片以及多套互连方案,仍然相当复杂;电力约束也依旧存在。NVIDIA推出的动态供电软件DSX只是优化工具,并不能增加电力供给。至于Groq集成所宣称的性能数据,也仍需在客户现场进一步验证。”