据SiliconANGLE 17日(当地时间)报道,NVIDIA在GTC 2026开发者大会上发布了面向AI推理场景的专用芯片Groq 3 LPU,重点瞄准多智能体推理需求。
NVIDIA表示,Groq 3 LPU不同于传统GPU,主要针对AI模型推理进行了优化,可为多智能体系统提供高带宽、低时延支持,与GPU形成互补。
按照NVIDIA的介绍,Groq 3 LPU将部署于专用服务器机架Groq 3 LPX。该机架搭载256颗Groq 3 LPU,总带宽可达40PB/s。
公司还计划将Groq 3 LPU与Rubin GPU结合,部署在Vera Rubin NVL72机架上,目标是实现单位功耗吞吐提升35倍、收益提升10倍。
除Groq 3 LPX和Vera Rubin NVL72外,NVIDIA此次还发布了Vera CPU机架、Bluefield-4 STX存储机架以及Spectrum-6 SPX网络机架。
记者信息