随着生成式AI加速普及,高性能推理需求迅速上升,多家头部AI企业开始通过收紧订阅政策、调整使用规则来应对成本压力。市场分析认为,现有订阅模式已越来越难承载持续扩大的算力消耗。
据Business Insider当地时间4月23日报道,Microsoft旗下GitHub Copilot已暂时停止学生版、Pro和Pro+套餐的新用户订阅;Anthropic则正测试对低价付费用户限制Claude Code的使用范围。
市场普遍认为,这并非单纯的运营调整,而是生成式AI服务商业模式压力的集中显现。早期AI企业依靠低价、易接入的服务快速获取用户,但近期围绕使用限制和价格调整的不满正在扩大。
压力上升的一个重要背景,是Agent式AI的快速扩散。借助相关自动化工具,用户可让AI模型近乎全天候运行,算力消耗已超出部分既有套餐的覆盖范围。GitHub产品副总裁Joe Binder表示,长时间并发调用已明显超出原有方案的设计范围,一些请求产生的成本甚至高于套餐定价,而且这类情况正越来越常见。
Anthropic同样面临类似压力。公司在测试是否对低价套餐用户限制Claude Code后表示,目前仍处于测试阶段,如有重大调整,将提前通知用户。Anthropic增长负责人Amol Abassare也指出,过去的定价方案并不是围绕当前这种长时间使用Agent的场景设计的。
分析人士指出,需求增长速度已明显超出企业此前预期。Gartner分析师Arun Chandrasekaran表示,如果仍停留在2022年初期模型的定价和商业逻辑上,企业很难建立可持续的商业模式;一方面,厂商需要把免费用户转化为付费用户,另一方面,还必须证明高性能新模型的实际价值,面临双重挑战。
与此同时,计算基础设施的区域性限制也在加大行业压力。由于数据中心分布不同,服务质量和处理速度可能出现差异,全球需求也难以像单一资源那样统一调度,跨区域调配存在明显限制。因此,有观点担心,非美国用户可能会比美国用户更早遇到服务瓶颈。
在这一背景下,AI企业可采取的应对方式并不多,主要包括提升模型效率、分散处理请求以及调整用户优先级。随着成本持续上升,竞争已不再只是技术路线之争,价格策略和服务可获得性也正成为关键变量。
OpenAI此前也曾推进旧模型调整。公司原计划于2025年8月终止旧版GPT-4o服务,但在用户反对后撤回决定;不过到2026年2月,该服务最终仍被终止。近期,OpenAI推出了新的图像生成模型,并向部分付费用户上线云端Agent;而此前颇受欢迎的视频生成应用Sora也已于上月宣布停止服务。
业内普遍认为,未来AI竞争的核心将不止于模型性能本身,更在于企业能否持续获取并稳定运营大规模算力资源。生成式AI市场也正从“功能竞争”迅速转向“基础设施与盈利能力竞争”,谁能建立与服务扩张速度相匹配的算力供给体系和可持续定价机制,谁就更有可能拉开与同行的差距。