NVIDIA发布参数规模达5500亿的开源大模型Nemotron 3 Ultra,并宣布下一代AI服务器平台Vera Rubin进入量产阶段,进一步完善其从模型到数据中心基础设施的整体布局,抢攻企业级AI市场。
据GIGAZINE当地时间1日报道称,NVIDIA首席执行官Jensen Huang在“NVIDIA GTC Taipei 2026”主题演讲中发布了Nemotron 3 Ultra和Vera Rubin平台。
其中,Nemotron 3 Ultra是一款5500亿参数的大语言模型。NVIDIA表示,该模型将以开源形式对外发布,并计划于本周正式上线。
NVIDIA称,Nemotron 3 Ultra在美国企业推出的开源模型中处于第一梯队。根据公司公布的资料,在与中国GLM 5.1、Kimi K2.6、Qwen 3.5等主要开源模型对比的多项基准测试中,Nemotron 3 Ultra展现出较强竞争力。NVIDIA同时强调,该模型在成本效率方面优于中国竞争对手的同类产品。
不过,外部评测结果显示,Nemotron 3 Ultra与中国头部模型仍存在一定差距。AI评测机构Artificial Analysis公布的AAI(Artificial Analysis Intelligence Index)显示,Nemotron 3 Ultra得分为48分,明显高于Google Gemma 4 31B的39分,但低于中国模型Kimi K2.6的54分。
相比单一性能指标,NVIDIA更强调模型的实际可用性。公司表示,在综合评分接近的竞品中,Nemotron 3 Ultra的每秒Token生成速度更具优势,重点突出真实服务场景下的处理速度和成本效率。
另一项核心发布是下一代AI服务器平台Vera Rubin。该平台现已进入量产阶段,以NVIDIA下一代AI GPU“Rubin”和自研AI CPU“Vera”为核心,并整合高性能存储和网络系统,面向数据中心部署。
NVIDIA表示,在Agent AI应用环境下,Vera Rubin相较上一代系统具备更高的处理效率。随着AI产业从聊天机器人向可自主执行任务的Agent AI演进,相关数据中心需求也在快速增长。
在业内看来,此次发布的意义不止于推出一款新模型和一套新平台,市场更关注的是NVIDIA围绕模型研发、推理到数据中心基础设施供给的全链条布局正在进一步落地。
Jensen Huang当天还公布了面向Windows 11 AI PC市场的新产品,包括将Arm架构CPU与NVIDIA GPU结合的笔记本SoC“RTX Spark”,以及高性能AI工作站“DGX Station”。
不过,市场关注的焦点仍集中在Nemotron 3 Ultra和Vera Rubin。随着开源大模型竞争逐步演变为中美企业之间的主导权之争,NVIDIA正试图通过模型性能、推理速度和成本效率进一步强化自身竞争话语权。
接下来,市场将关注Nemotron 3 Ultra正式开源后的许可策略和使用范围如何设定,以及Vera Rubin量产后能否更快承接企业级AI和Agent AI市场需求。
业内普遍认为,此次发布再次表明,NVIDIA正将AI软件与硬件整合为统一生态,以扩大其市场影响力和主导地位。
NVIDIA表示,Nemotron 3 Ultra将于本周正式开源发布。