图片来源:Shutterstock

据SiliconANGLE 17日(当地时间)报道,NVIDIA在GTC 2026开发者大会上发布了面向AI推理场景的专用芯片Groq 3 LPU,重点瞄准多智能体推理需求。

NVIDIA表示,Groq 3 LPU不同于传统GPU,主要针对AI模型推理进行了优化,可为多智能体系统提供高带宽、低时延支持,与GPU形成互补。

按照NVIDIA的介绍,Groq 3 LPU将部署于专用服务器机架Groq 3 LPX。该机架搭载256颗Groq 3 LPU,总带宽可达40PB/s。

公司还计划将Groq 3 LPU与Rubin GPU结合,部署在Vera Rubin NVL72机架上,目标是实现单位功耗吞吐提升35倍、收益提升10倍。

除Groq 3 LPX和Vera Rubin NVL72外,NVIDIA此次还发布了Vera CPU机架、Bluefield-4 STX存储机架以及Spectrum-6 SPX网络机架。

关键词

#NVIDIA #GTC 2026 #Groq 3 LPU #AI推理 #多智能体推理 #Groq 3 LPX #Vera Rubin NVL72 #Rubin GPU #Bluefield-4 STX #Spectrum-6 SPX
版权所有 © DigitalToday。未经授权禁止转载或传播。