图片来源:Reve AI

随着能够自主执行特定任务的Agentic AI需求快速升温,AI算力供需矛盾正进一步加剧。

算力紧张不仅推高了AI服务成本,也让相关资源更难获取,服务稳定性随之承压。

《华尔街日报》近日报道称,作为AI核心基础设施的GPU,其按小时租赁价格自去年秋季以来明显上涨;Anthropic则在高峰时段限制算力使用额度,由此引发客户不满。

即便持续加码AI基础设施投入,OpenAI也未能完全摆脱算力资源紧张的影响。OpenAI近期暂停视频生成AI应用“Sora”,外界分析认为,这与其将更多算力转向编程及企业级产品有关。

据《华尔街日报》报道,通过OpenAI API产生的Token用量,已从去年10月的每分钟60亿增至3月底的每分钟150亿。Token是AI模型处理文本的基本单位,也是衡量模型算力消耗的重要指标。

与此同时,GPU使用成本也在快速攀升。面向AI的云计算服务商CoreWeave于去年底将价格上调超过20%,并要求部分小型客户将合约期限从1年延长至3年。数据提供商Ornn的数据显示,近几个月云服务市场上的NVIDIA GPU价格显著上涨,其中NVIDIA最新Blackwell芯片的小时租赁价格较两个月前上涨了48%。

算力短缺也开始直接冲击AI企业的服务稳定性。业务快速扩张的Anthropic自2月中旬以来故障发生得更加频繁,促使部分客户转向其他AI模型。

从目前情况看,AI行业面临的算力供给不足问题短期内仍难缓解。

《华尔街日报》援引云基础设施公司Vultr首席执行官J.J. Cardwell的话称,公司运营五年多来,从未见过如此严重的容量短缺。外界或许会问,为什么不部署更多设备,但问题在于交付周期过长:一方面,数据中心建设本身需要时间;另一方面,到2026年可用的电力资源也已基本被提前锁定。

工程师兼科技投资人Ben Poladian表示,尽管人们一直在谈论石油,但当下全球最稀缺的其实是Token。他认为,如今的AI早已不再只是“站在冰箱前询问菜谱”的简单聊天机器人,而是在执行任务,并且正变得越来越智能。

关键词

#AI算力 #GPU租赁 #云计算 #Anthropic #OpenAI #CoreWeave #NVIDIA Blackwell #Vultr #Token用量 #AI基础设施
版权所有 © DigitalToday。未经授权禁止转载或传播。