图片来源:Shutterstock

据《华尔街日报》(WSJ)当地时间2月27日援引多位知情人士报道,NVIDIA正准备推出一款面向AI推理的新芯片,主要用于处理AI模型生成回复等推理任务。

知情人士称,这款芯片计划在3月举行的NVIDIA GTC开发者大会上亮相,相关方案可能引入AI芯片初创公司Groq的技术。

WSJ指出,AI推理市场近期正迅速成为科技行业竞争焦点。Google、Amazon等厂商正相继推出对标NVIDIA GPU的AI芯片;随着AI编程应用不断普及,市场对能够更高效处理AI任务的新型芯片需求也在升温。

报道称,OpenAI预计将大规模采用NVIDIA这款新型推理芯片。过去几个月,OpenAI已采购多款被视为可替代NVIDIA方案的高效率芯片,并于上月与AI芯片初创公司Cerebras达成交易。

一直以来,NVIDIA都强调其GPU在训练和推理两大场景中的领先地位。在这一背景下,公司拟推出推理专用芯片,被市场视为对高性价比推理芯片需求上升的回应。

值得关注的是,定位为“NVIDIA替代者”的厂商长期以来更聚焦推理市场,而非对性能要求更高的训练场景。NVIDIA此次加码推理专用芯片,或将为AI芯片市场竞争格局增添变数。

报道称,NVIDIA这款推理产品所采用的相关方案据称基于Groq的LPU(Language Processing Unit)架构。与NVIDIA主力GPU产品线不同,Groq的LPU不使用HBM,而是将SRAM(Static Random Access Memory)直接集成在芯片上,以提升访问速度。业内有观点称,其访问速度最高可达搭载HBM的GPU的100倍。

关键词

#NVIDIA #GTC #AI推理 #推理芯片 #GPU #Groq #LPU #SRAM #HBM #OpenAI
版权所有 © DigitalToday。未经授权禁止转载或传播。