图片来源:Shutterstock

据《华尔街日报》13日(当地时间)报道,Amazon Web Services(AWS)已与AI芯片初创公司Cerebras签署多年合作协议,计划在其数据中心部署Cerebras芯片。

根据合作安排,AWS将把Cerebras的“Wafer-Scale Engine”部署至数据中心,并结合自研Trainium芯片提供AI推理服务。所谓推理,是指AI模型针对用户提问生成答案的过程。

Cerebras表示,其芯片在推理关键环节“解码”上的处理速度最高可达NVIDIA GPU的25倍。AWS与Cerebras希望借此合作,推出定价更高的高速AI推理服务。

今年1月,Cerebras还与OpenAI签署了一份金额超过100亿美元的合同。根据计划,OpenAI将基于Cerebras芯片建设最高达750MW规模的算力设施。2月,Cerebras又获得10亿美元新增融资,公司估值升至230亿美元。

另外,NVIDIA去年12月也与芯片初创公司Groq达成了一项规模达200亿美元的协议,并计划于下周发布采用Groq技术的推理专用处理系统。Cerebras首席执行官Andrew Feldman表示,随着越来越多用户更频繁地借助AI处理更复杂的问题,此次将Cerebras-Trainium解决方案引入全球最大的云平台,有望触达大批客户。

关键词

#AWS #Cerebras #AI推理 #Wafer-Scale Engine #Trainium #NVIDIA GPU #数据中心 #OpenAI
版权所有 © DigitalToday。未经授权禁止转载或传播。