NVIDIA明确将战略重心转向Agent AI时代,并进一步强化其面向下一代AI基础设施的定位。中国台湾地区媒体 IT Home 6月1日(当地时间)报道称,NVIDIA CEO Jensen Huang在Computex首场主题演讲中发布了下一代“Vera Rubin”平台、企业级Agent开发平台,以及面向AI工厂运营的DSX。
Jensen Huang表示,真正具备实际价值的AI已经到来,AI正在从“成本中心”转变为能够“创造收入”的基础。他还指出,未来十年,企业竞争力将取决于AI基础设施的建设、管理与运营能力。
在他看来,过去两年,行业重心已从生成式AI逐步转向Agent AI。未来,企业级应用也将从以代码和操作系统为中心的架构,重构为以大语言模型、Agent框架、记忆系统、工具和运行环境为核心的新体系。
这也意味着,AI将不再停留在简单问答层面,而是能够理解上下文、规划工作流,并通过调用工具、访问数据库等方式,完成代码生成、CAD设计、文档处理和业务流程执行等任务。
在软件层面,NVIDIA同步推出企业级Agent开发平台,涵盖Nemotron开源模型、Open Shell运行环境、AI Agent框架、CUDA-X函数库,以及安全与治理体系。新模型“Nemotron 3 Ultra”采用SSM与混合专家架构,推理速度较上一代提升5倍,成本降低30%。NVIDIA还开放了训练数据、训练脚本和工具链,帮助企业构建自有Agent。
应用落地方面,NVIDIA还披露了与Cadence合作的案例。双方推出的芯片设计Agent可实现RTL验证、仿真和调试自动化,将原本需要数周的验证流程压缩至数小时,效率提升超过40倍。
硬件方面,面向下一代AI的“Vera Rubin”平台已进入全面量产阶段。Jensen Huang表示,Hopper主要面向训练,Grace Blackwell侧重推理,而Vera Rubin则瞄准Agent AI。该平台整合了Vera CPU、Rubin GPU、NVLink 72、BlueField DPU、ConnectX-9 SuperNIC以及下一代存储设备。
除数据中心外,NVIDIA还将布局延伸至AI PC市场。“NVIDIA RTX Spark”采用台积电3nm工艺芯片,集成具备6144个CUDA核心的Blackwell RTX GPU、20核Grace CPU以及128GB LPDDR5统一内存。与此同时,NVIDIA还与Microsoft合作推动面向Agent的Windows 11平台,并提出由操作系统直接调度GPU和AI加速资源的架构设想。
在AI基础设施运营层面,DSX被定位为AI工厂的参考架构与操作系统,覆盖规划与仿真、电力管理、液冷管理、GPU部署优化以及电网联动等功能。Jensen Huang表示,当前不少AI数据中心约有40%的电力分配被浪费,而通过动态电力分配、电力负荷平滑以及基于Agent的冷却控制,可进一步提升整体利用率。