NVIDIA CEO Jensen Huang：AI正加速迈入Agent AI时代

NVIDIA CEO Jensen Huang在“Rack Scale”产品展示前发表主题演讲。图片来源：NVIDIA

NVIDIA明确将战略重心转向Agent AI时代，并进一步强化其面向下一代AI基础设施的定位。中国台湾地区媒体 IT Home 6月1日（当地时间）报道称，NVIDIA CEO Jensen Huang在Computex首场主题演讲中发布了下一代“Vera Rubin”平台、企业级Agent开发平台，以及面向AI工厂运营的DSX。

Jensen Huang表示，真正具备实际价值的AI已经到来，AI正在从“成本中心”转变为能够“创造收入”的基础。他还指出，未来十年，企业竞争力将取决于AI基础设施的建设、管理与运营能力。

在他看来，过去两年，行业重心已从生成式AI逐步转向Agent AI。未来，企业级应用也将从以代码和操作系统为中心的架构，重构为以大语言模型、Agent框架、记忆系统、工具和运行环境为核心的新体系。

这也意味着，AI将不再停留在简单问答层面，而是能够理解上下文、规划工作流，并通过调用工具、访问数据库等方式，完成代码生成、CAD设计、文档处理和业务流程执行等任务。

在软件层面，NVIDIA同步推出企业级Agent开发平台，涵盖Nemotron开源模型、Open Shell运行环境、AI Agent框架、CUDA-X函数库，以及安全与治理体系。新模型“Nemotron 3 Ultra”采用SSM与混合专家架构，推理速度较上一代提升5倍，成本降低30%。NVIDIA还开放了训练数据、训练脚本和工具链，帮助企业构建自有Agent。

应用落地方面，NVIDIA还披露了与Cadence合作的案例。双方推出的芯片设计Agent可实现RTL验证、仿真和调试自动化，将原本需要数周的验证流程压缩至数小时，效率提升超过40倍。

硬件方面，面向下一代AI的“Vera Rubin”平台已进入全面量产阶段。Jensen Huang表示，Hopper主要面向训练，Grace Blackwell侧重推理，而Vera Rubin则瞄准Agent AI。该平台整合了Vera CPU、Rubin GPU、NVLink 72、BlueField DPU、ConnectX-9 SuperNIC以及下一代存储设备。

除数据中心外，NVIDIA还将布局延伸至AI PC市场。“NVIDIA RTX Spark”采用台积电3nm工艺芯片，集成具备6144个CUDA核心的Blackwell RTX GPU、20核Grace CPU以及128GB LPDDR5统一内存。与此同时，NVIDIA还与Microsoft合作推动面向Agent的Windows 11平台，并提出由操作系统直接调度GPU和AI加速资源的架构设想。

在AI基础设施运营层面，DSX被定位为AI工厂的参考架构与操作系统，覆盖规划与仿真、电力管理、液冷管理、GPU部署优化以及电网联动等功能。Jensen Huang表示，当前不少AI数据中心约有40%的电力分配被浪费，而通过动态电力分配、电力负荷平滑以及基于Agent的冷却控制，可进一步提升整体利用率。

Hyunwoo Choo cookinpapa@d-today.co.kr

关键词