NVIDIA发布新一代AI平台Rubin：每token推理成本降至Blackwell十分之一

生成中...

Daegeon Seok

发布时间 2026-01-06 11:16:11

搜索关键词

NVIDIA于6日在CES 2026上发布新一代AI平台Rubin。

Rubin平台由6款全新芯片组成，面向新一代AI超级计算机构建需求，具体包括Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6 Ethernet Switch。

NVIDIA表示，Rubin围绕上述6款芯片进行了深度协同设计，可缩短训练时间并显著降低推理成本。其中，每token推理成本可降至Blackwell平台的十分之一，MoE模型训练所需GPU数量也降至原来的四分之一。公司称，这一提升主要得益于最新NVLink互连技术、Transformer Engine、Confidential Computing、RAS Engine以及Vera CPU等关键技术与架构创新。

目前，Rubin已进入量产阶段，基于该平台的相关产品预计将于2026年下半年由合作伙伴推出。NVIDIA列出的云服务商包括AWS、Google Cloud、Microsoft和OCI，云合作伙伴则包括CoreWeave、Lambda、Nebuious和Nscale等，这些厂商计划于2026年率先部署基于Vera Rubin的实例。Microsoft还计划在下一代AI数据中心部署Vera Rubin NVL72机架级系统，其中包括Fairwater AI超级工厂。

在互连性能方面，NVLink 6可为每块GPU提供3.6TB/s带宽，Vera Rubin NVL72机架总带宽可达260TB/s。NVIDIA称，其规模“超过整个互联网”。Vera CPU采用定制Olympus核心，共88个，兼容Armv9.2，并支持高速NVLink-C2C连接。Rubin GPU搭载第三代Transformer Engine，支持硬件加速的自适应压缩技术，可为AI推理提供50PF的NVFP4算力。

BlueField-4引入高级安全可信资源架构ASTRA。NVIDIA介绍称，这是一种系统级可信架构，可为AI基础设施建设者提供统一可信控制点，在不影响性能的前提下，对大规模AI环境进行安全配置、隔离和运营。Spectrum-X以太网光子共封装光交换系统可将面向AI应用的可靠性提升10倍，并将运行时长提升至5倍。

NVIDIA创始人兼CEO Jensen Huang表示，AI训练与推理的算力需求正以前所未有的速度增长，Rubin的推出正当其时。他还表示，NVIDIA每年都会推出下一代AI超级计算机，而Rubin通过对6款芯片的深度协同设计，将推动AI进入新的发展阶段。

Daegeon Seok d2dg@d-today.co.kr