NVIDIA于6日在CES 2026上发布新一代AI平台Rubin。
Rubin平台由6款全新芯片组成,面向新一代AI超级计算机构建需求,具体包括Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6 Ethernet Switch。
NVIDIA表示,Rubin围绕上述6款芯片进行了深度协同设计,可缩短训练时间并显著降低推理成本。其中,每token推理成本可降至Blackwell平台的十分之一,MoE模型训练所需GPU数量也降至原来的四分之一。公司称,这一提升主要得益于最新NVLink互连技术、Transformer Engine、Confidential Computing、RAS Engine以及Vera CPU等关键技术与架构创新。
目前,Rubin已进入量产阶段,基于该平台的相关产品预计将于2026年下半年由合作伙伴推出。NVIDIA列出的云服务商包括AWS、Google Cloud、Microsoft和OCI,云合作伙伴则包括CoreWeave、Lambda、Nebuious和Nscale等,这些厂商计划于2026年率先部署基于Vera Rubin的实例。Microsoft还计划在下一代AI数据中心部署Vera Rubin NVL72机架级系统,其中包括Fairwater AI超级工厂。
在互连性能方面,NVLink 6可为每块GPU提供3.6TB/s带宽,Vera Rubin NVL72机架总带宽可达260TB/s。NVIDIA称,其规模“超过整个互联网”。Vera CPU采用定制Olympus核心,共88个,兼容Armv9.2,并支持高速NVLink-C2C连接。Rubin GPU搭载第三代Transformer Engine,支持硬件加速的自适应压缩技术,可为AI推理提供50PF的NVFP4算力。
BlueField-4引入高级安全可信资源架构ASTRA。NVIDIA介绍称,这是一种系统级可信架构,可为AI基础设施建设者提供统一可信控制点,在不影响性能的前提下,对大规模AI环境进行安全配置、隔离和运营。Spectrum-X以太网光子共封装光交换系统可将面向AI应用的可靠性提升10倍,并将运行时长提升至5倍。
NVIDIA创始人兼CEO Jensen Huang表示,AI训练与推理的算力需求正以前所未有的速度增长,Rubin的推出正当其时。他还表示,NVIDIA每年都会推出下一代AI超级计算机,而Rubin通过对6款芯片的深度协同设计,将推动AI进入新的发展阶段。