NVIDIA在GTC 2026发布Vera Rubin并公布Groq 3 LPX，AI加速迈向制造、出行与医疗场景

在GTC 2026上，NVIDIA一口气推出7款芯片、5款机架产品，以及推理操作系统、Agent框架、机器人数据管道等一系列软硬件方案。若从发布内容看，涉及的产品和技术已多达数十项，但其主线可以归结为三点：AI算力成本持续下探、软件商业化路径加速成形，以及AI进一步走出数据中心，进入制造、出行与医疗等现实场景。

其中，Vera Rubin将token成本降至原来的十分之一，Groq 3 LPX将推理吞吐提升至现有方案的35倍，而NVIDIA所强调的Physical AI市场则被描述为规模可达100万亿美元。上述三组数字，正在重新定义半导体、软件和制造业的竞争逻辑。

◆ 从算力成本下降到Agent落地，再到进入物理世界

此次GTC上，NVIDIA重点展示了机架级下一代平台Vera Rubin。该平台将7款芯片与5款机架整合为一套AI超级计算系统。按NVIDIA的说法，与Blackwell相比，Vera Rubin只需四分之一的GPU数量即可完成大规模MoE模型训练，同时可将token成本降至原来的十分之一、每瓦推理吞吐最高提升10倍。由此，产业竞争的焦点也正从单颗GPU性能，转向机架级一体化系统能力。

Vera CPU同样是外界关注的重点。该产品采用自研Olympus Core，配备88个核心，基于LPDDR5X，最高带宽可达1.2TB/s。NVIDIA称，相比通用CPU，其带宽可提升2倍、功耗降低50%。NVIDIA还表示，Alibaba、ByteDance、Meta、CoreWeave等公司正推进相关导入。与此同时，CEO Jensen Huang还预告了下一代架构“Feynman”，并披露了Rosa CPU、LP40 LPU、BlueField-5等产品路线图。

支撑该平台的基础设施扩张也在明显提速。NVIDIA表示，云合作伙伴在全球AI工厂累计部署的GPU已超过100万颗，对应AI处理能力合计超过1.7GW；相比上一年GTC披露的40万颗和550MW，规模已扩大逾两倍。以Microsoft Azure为例，其已成为首个运行Vera Rubin NVL72的超大规模云平台。

在供应链层面，韩国企业被NVIDIA列为关键部件供应方。Samsung Electronics表示，Jensen Huang在GTC现场于Samsung HBM4晶圆上手写签下“AMAZING HBM4”。Samsung Electronics强调，公司是唯一能够为Vera Rubin提供完整内存与存储产品组合的厂商，涵盖HBM4、SOCAMM2、SSD PM1763等，并在本届GTC首次公开HBM4E实物芯片，目标单pin速率为16Gbps、带宽为4.0TB/s。SK hynix方面，Chey Tae-won与CEO Kwak Noh-jung到场参会，并展示了HBM4、HBM3E、SOCAMM2等产品，进一步强化其在相关供应链中的角色。

◆ Vera Rubin、Groq 3 LPX与Physical AI：token成本进入“十分之一时代”

第二个值得关注的变化，是推理成本快速下降所带来的新经济结构。其核心之一，是GTC 2026上公布的Groq 3 LPX。该架构以机架形态将GPU与LPU（语言处理单元）整合在一起。NVIDIA称，在1万亿参数模型基准下，Groq 3 LPX可实现每秒500 token、每百万token成本45美元，整体处理能力较既有方案提升35倍。

围绕这一推理体系，NVIDIA也同步完善软件栈。Dynamo 1.0被定位为AI工厂的分布式操作系统，可将Blackwell GPU的推理性能最高提升7倍；OpenClO与NemoClO则被定义为Agentic AI编排框架。NVIDIA称，OpenClO已在GitHub获得10万Star，首周访问量达到200万人次。

企业端的采用案例也在增加。根据NVIDIA简报材料，Salesforce已覆盖1.8万名客户，CrowdStrike每周可节省40小时，Cisco的推理效率则提升2至3倍。

这套推理基础设施也在从数据中心向边缘侧延伸。NVIDIA发布的DGX Station GB300配备748GB统一内存，最高可提供20PFLOPS FP4性能，能够在桌面端运行1万亿参数模型。

与此同时，NVIDIA表示，AT&T、T-Mobile、Comcast、Spectrum等主要运营商正基于其基础设施建设“AI Grid”，借助全球约10万个分布式网络数据中心和超过100GW的备用电力，在更接近用户、设备和数据的位置完成推理。

在制造环节，Samsung Foundry 4nm承接Groq LPU生产也引发市场关注。Jensen Huang在Samsung Foundry 4nm晶圆上签下“Groq Super FAST”，外界普遍将此解读为韩国企业在推理加速供应链中的角色进一步明确。

◆ 手术室、工厂与道路场景：Physical AI加速落地

第三个变化，是AI正从数字世界进一步走向物理场景。NVIDIA将Physical AI市场规模描述为约100万亿美元，约为IT产业规模（约2万亿美元）的50倍。作为Physical AI“数据工厂”的Blueprint，将提供具体落地工具，并基于Cosmos世界模型与Osmo编排器，打通数据生成、仿真、评估和部署的全流程管道。NVIDIA表示，该项目计划于4月在GitHub开源。

应用范围也正从制造和出行扩展至医疗。NVIDIA称，Hyundai Motor Group将在Drive Hyperion平台基础上推进L2及以上自动驾驶，并扩大与Motional在L4级Robotaxi领域的合作。在医疗领域，NVIDIA发布了面向医疗场景的Physical AI平台，包括Open-H（含776小时手术视频数据集）、Cosmos-H（用于生成合成手术数据）以及GR00T-H（手术机器人动作模型）等，CMR Surgical、Johnson & Johnson MedTech等企业正推进导入。

制造端方面，HD Hyundai推出了基于Omniverse的工业数字孪生方案；Samsung Electronics、SK hynix、MediaTek则将NVIDIA加速技术引入EDA软件，以提升DRAM和闪存生产效率。从设计、制造到医疗，相关产业链正在进一步向CUDA-X生态聚拢。

整体来看，NVIDIA在GTC 2026释放出的核心信号是：通过持续降低算力成本，提高Agent落地的经济性，并进一步推动AI从数据中心走向物理世界。与此同时，韩国企业在内存、代工和自动驾驶等环节的合作角色正在上升，但对单一平台依赖加深的问题也随之浮现。

Dae-geon Seok d2dg@d-today.co.kr

关键词