NVIDIA发布5500亿参数开源大模型Nemotron 3 Ultra，Vera Rubin平台进入量产阶段

NVIDIA此次同步推出开源大模型与新一代平台，进一步加码AI软硬件布局。图片来源：NVIDIA YouTube截图

NVIDIA发布参数规模达5500亿的开源大模型Nemotron 3 Ultra，并宣布下一代AI服务器平台Vera Rubin进入量产阶段，进一步完善其从模型到数据中心基础设施的整体布局，抢攻企业级AI市场。

据GIGAZINE当地时间1日报道称，NVIDIA首席执行官Jensen Huang在“NVIDIA GTC Taipei 2026”主题演讲中发布了Nemotron 3 Ultra和Vera Rubin平台。

其中，Nemotron 3 Ultra是一款5500亿参数的大语言模型。NVIDIA表示，该模型将以开源形式对外发布，并计划于本周正式上线。

NVIDIA称，Nemotron 3 Ultra在美国企业推出的开源模型中处于第一梯队。根据公司公布的资料，在与中国GLM 5.1、Kimi K2.6、Qwen 3.5等主要开源模型对比的多项基准测试中，Nemotron 3 Ultra展现出较强竞争力。NVIDIA同时强调，该模型在成本效率方面优于中国竞争对手的同类产品。

不过，外部评测结果显示，Nemotron 3 Ultra与中国头部模型仍存在一定差距。AI评测机构Artificial Analysis公布的AAI（Artificial Analysis Intelligence Index）显示，Nemotron 3 Ultra得分为48分，明显高于Google Gemma 4 31B的39分，但低于中国模型Kimi K2.6的54分。

相比单一性能指标，NVIDIA更强调模型的实际可用性。公司表示，在综合评分接近的竞品中，Nemotron 3 Ultra的每秒Token生成速度更具优势，重点突出真实服务场景下的处理速度和成本效率。

另一项核心发布是下一代AI服务器平台Vera Rubin。该平台现已进入量产阶段，以NVIDIA下一代AI GPU“Rubin”和自研AI CPU“Vera”为核心，并整合高性能存储和网络系统，面向数据中心部署。

NVIDIA表示，在Agent AI应用环境下，Vera Rubin相较上一代系统具备更高的处理效率。随着AI产业从聊天机器人向可自主执行任务的Agent AI演进，相关数据中心需求也在快速增长。

在业内看来，此次发布的意义不止于推出一款新模型和一套新平台，市场更关注的是NVIDIA围绕模型研发、推理到数据中心基础设施供给的全链条布局正在进一步落地。

Jensen Huang当天还公布了面向Windows 11 AI PC市场的新产品，包括将Arm架构CPU与NVIDIA GPU结合的笔记本SoC“RTX Spark”，以及高性能AI工作站“DGX Station”。

不过，市场关注的焦点仍集中在Nemotron 3 Ultra和Vera Rubin。随着开源大模型竞争逐步演变为中美企业之间的主导权之争，NVIDIA正试图通过模型性能、推理速度和成本效率进一步强化自身竞争话语权。

接下来，市场将关注Nemotron 3 Ultra正式开源后的许可策略和使用范围如何设定，以及Vera Rubin量产后能否更快承接企业级AI和Agent AI市场需求。

业内普遍认为，此次发布再次表明，NVIDIA正将AI软件与硬件整合为统一生态，以扩大其市场影响力和主导地位。

NVIDIA表示，Nemotron 3 Ultra将于本周正式开源发布。

Jinju Hong hongjj@d-today.co.kr

关键词