企业AI成本攀升，大模型主导地位松动

企业部署AI的成本正在迅速攀升，长期由大模型主导的行业格局也开始出现松动。

据TechCrunch 6月9日（当地时间）报道，过去，AI模型厂商主要依靠融资补贴，将推理成本维持在相对较低水平，使企业能够以低于真实成本的价格使用高端模型。

但随着企业AI导入步伐加快、相关支出持续扩大，企业对成本的敏感度正在明显上升，市场重心也开始从“追求最强模型”转向“追求更高性价比”。

美国加密货币交易所Coinbase CEO Brian Armstrong预计，未来12至18个月内，约80%的工作将转向成本降低99%的模型。他认为，AI需求几乎是无限的，但真正必须依赖最新一代大模型的任务，可能只占20%。

TechCrunch指出，如果这一判断成为现实，AI产业的经济逻辑可能发生根本性变化。

过去，面向企业的AI服务竞争重点更多在模型能力本身，厂商普遍倾向采用最先进的模型。但如果价格更低的中小模型也能提供相近效果，那么节省下来的成本将直接冲击OpenAI、Anthropic等公司的盈利空间。TechCrunch称，OpenAI与Anthropic均处于IPO前夕，这一变化带来的影响可能更为明显。若大多数工作最终都可由中小模型完成，市场将更难解释为何还要投入数千亿美元训练前沿大模型。

围绕低成本模型的降本案例也已开始出现。AI法律科技公司Harvey与推理平台Fireworks AI合作，将Anthropic Claude Opus与中国AI公司Zhipu AI开发的开源模型GLM 5.1结合使用，在不降低质量的情况下，将推理成本降至原来的三分之一。

Harvey联合创始人Gabe Pereira表示，市场对“质量”的定义正在发生变化——不再是“所有任务都使用最强模型”，而是“用最高效的模型得到正确答案”。

TechCrunch认为，外界往往把近期变化解读为闭源模型与开源模型之争，但更核心的问题其实是“该用大模型还是小模型”。报道指出，即便只是从GPT-5.5切换到DeepSeek v4 Flash，或者改用GPT-5.4-mini，成本同样会明显下降。

无代码AI Agent平台Lindy也是其中一个代表案例。该公司已将基础模型从Anthropic切换至DeepSeek v4。

据TheNewsStack报道，Lindy创始人兼CEO Flo Crivello近日在社交平台X（Twitter）上表示，公司已将全部流量切换至DeepSeek v4，此举不仅节省了数百万美元，在核心使用场景下，模型表现反而有所提升。他将这一变化称为“对业务而言的颠覆性转变”。

Crivello早在今年4月就曾表示，AI推理已经成为Lindy最大的成本项，甚至超过人力成本。Lindy在评估开源模型6至9个月后，最终选择DeepSeek v4，但迁移过程并不轻松，复杂程度远超预期。Crivello称，“实际工作量比原先预计高出100倍”，主要挑战包括在真实业务环境中验证模型表现，以及重写提示词。他同时表示，后续市场格局仍可能继续变化，“如果Anthropic在下一代模型上大幅降价，我们也可能切回去”。

在AI成本上升与安全担忧并存的背景下，作为AI运行硬件载体的PC，存在感也在增强。半导体厂商正加大对PC端AI芯片的投入，PC厂商动作频频，面向本地运行场景的AI Agent也在加速涌现。

Chi-gyu Hwang delight@d-today.co.kr

关键词