企业部署AI的成本正在迅速攀升,长期由大模型主导的行业格局也开始出现松动。
据TechCrunch 6月9日(当地时间)报道,过去,AI模型厂商主要依靠融资补贴,将推理成本维持在相对较低水平,使企业能够以低于真实成本的价格使用高端模型。
但随着企业AI导入步伐加快、相关支出持续扩大,企业对成本的敏感度正在明显上升,市场重心也开始从“追求最强模型”转向“追求更高性价比”。
美国加密货币交易所Coinbase CEO Brian Armstrong预计,未来12至18个月内,约80%的工作将转向成本降低99%的模型。他认为,AI需求几乎是无限的,但真正必须依赖最新一代大模型的任务,可能只占20%。
TechCrunch指出,如果这一判断成为现实,AI产业的经济逻辑可能发生根本性变化。
过去,面向企业的AI服务竞争重点更多在模型能力本身,厂商普遍倾向采用最先进的模型。但如果价格更低的中小模型也能提供相近效果,那么节省下来的成本将直接冲击OpenAI、Anthropic等公司的盈利空间。TechCrunch称,OpenAI与Anthropic均处于IPO前夕,这一变化带来的影响可能更为明显。若大多数工作最终都可由中小模型完成,市场将更难解释为何还要投入数千亿美元训练前沿大模型。
围绕低成本模型的降本案例也已开始出现。AI法律科技公司Harvey与推理平台Fireworks AI合作,将Anthropic Claude Opus与中国AI公司Zhipu AI开发的开源模型GLM 5.1结合使用,在不降低质量的情况下,将推理成本降至原来的三分之一。
Harvey联合创始人Gabe Pereira表示,市场对“质量”的定义正在发生变化——不再是“所有任务都使用最强模型”,而是“用最高效的模型得到正确答案”。
TechCrunch认为,外界往往把近期变化解读为闭源模型与开源模型之争,但更核心的问题其实是“该用大模型还是小模型”。报道指出,即便只是从GPT-5.5切换到DeepSeek v4 Flash,或者改用GPT-5.4-mini,成本同样会明显下降。
无代码AI Agent平台Lindy也是其中一个代表案例。该公司已将基础模型从Anthropic切换至DeepSeek v4。
据TheNewsStack报道,Lindy创始人兼CEO Flo Crivello近日在社交平台X(Twitter)上表示,公司已将全部流量切换至DeepSeek v4,此举不仅节省了数百万美元,在核心使用场景下,模型表现反而有所提升。他将这一变化称为“对业务而言的颠覆性转变”。
Crivello早在今年4月就曾表示,AI推理已经成为Lindy最大的成本项,甚至超过人力成本。Lindy在评估开源模型6至9个月后,最终选择DeepSeek v4,但迁移过程并不轻松,复杂程度远超预期。Crivello称,“实际工作量比原先预计高出100倍”,主要挑战包括在真实业务环境中验证模型表现,以及重写提示词。他同时表示,后续市场格局仍可能继续变化,“如果Anthropic在下一代模型上大幅降价,我们也可能切回去”。
在AI成本上升与安全担忧并存的背景下,作为AI运行硬件载体的PC,存在感也在增强。半导体厂商正加大对PC端AI芯片的投入,PC厂商动作频频,面向本地运行场景的AI Agent也在加速涌现。