企业AI加速降本：模型路由、开源定制与用量管控成主流手段

随着企业对AI的使用持续升温，相关成本也在快速攀升。如何在保证效果的前提下控制投入，正成为企业部署AI时的核心议题。

越来越多公司开始从多个环节压降AI成本。除了继续使用OpenAI、Anthropic等高性能模型外，不少企业也在根据具体任务混合调用价格更低的模型。与此同时，能够按照任务复杂度自动分配模型的“模型路由器”也受到更多关注。还有一些企业选择引入开源模型并进行定制，以进一步降低支出。

据The Information报道，开发AI客服代理的Fin过去主要使用Anthropic的Sonnet模型，但在一年多前开始转向基于open-weight模型的定制化自研AI。该公司表示，最近几个月这一转型明显提速。

Fin称，这一调整每年可节省数亿美元成本，并明显改善利润率。近期据报道，Salesforce已以36亿美元收购Fin。

除优化模型选择外，也有企业开始直接管理员工的AI使用规模。Meta和Uber等公司已着手为员工可使用的AI额度设置上限。此前，两家公司一度允许员工不限量使用AI，但由于相关支出超出预算，随后转向更严格的管控机制。

还有一些公司开始对员工可使用的模型进行分级管理。为了控制成本，企业会区分哪些岗位可以使用高价模型，哪些岗位只能使用成本更低的替代方案。

与此同时，业内还出现了一种更轻量的降本思路：减少模型在推理环节的额外计算开销，同样能够显著降低费用。

企业软件公司UiPath就正在借助提示工程，尽量压缩模型在执行任务前的“思考”消耗。该公司表示，这种做法尤其适用于重复性工作，在部分任务场景下可将成本降低90%以上。

即便如此，Anthropic和OpenAI高性能模型的使用量仍在快速增长。市场普遍认为，只要这些模型在性能上仍明显领先开源模型，就能够在一定程度上降低用户流失风险。不过在当前阶段，二者与开源模型之间的能力差距正在缩小。

尤其是在中国开源模型方面，市场评价也在发生变化。其定位已不再只是“便宜但勉强能用”，而是整体能力明显提升。部分基准测试结果甚至显示，一些开源模型的表现已经超过OpenAI或Anthropic的产品。

多模型接入平台OpenRouter表示，6月第二周由开源模型处理的Token占比已升至约65%，明显高于今年1月的34%和去年同期的26%。其中，中国的DeepSeek和MiniMax表现尤为突出。

OpenRouter还表示，过去开源模型的主要使用者多为小型AI初创公司，但近期大型企业的需求也在持续增加。

软件开发工具公司Factory Data于6月1日推出模型路由器后，也观察到了与OpenRouter相似的趋势。Factory称，开源模型使用量较上月激增3倍。Adobe、IT服务商Ypro以及支付公司Adyen等均在使用其模型路由工具。

与Anthropic等商用模型相比，转向开源模型带来的降本效果尤为明显。软件开发公司Inflectra首席执行官Adam Sandman表示，公司将部分业务从Anthropic模型切换至阿里巴巴开源模型Qwen后，其软件开发流程中用于图像和视频分析的相关产品功能，AI成本下降了99%。

美国最大加密货币交易所Coinbase也表示，在提升Token使用量的同时，公司借助中国开源模型将AI支出压缩了近一半。

Coinbase首席执行官Brian Armstrong称，公司已优先接入Z.ai GLM 5.2和Moonshot Kimi 2.7。

Armstrong还表示，公司正在让工程师更清楚地掌握各自的Token使用情况。工程师可以根据需要在不同模型上使用Token，但所有用量都会被可视化。他强调，企业的目标并不是单纯压低Token消耗，而是减少被浪费的Token；关键也不在于限制使用，而是建设一套能够支撑指数级增长的可持续基础设施。

在AI将进一步深入企业场景的背景下，AI成本管理的重要性预计还会继续上升。

也有观点指出，AI成本与云计算或SaaS支出的性质并不相同，因此需要采用不同的管理方式。

据SiliconANGLE报道，Gartner副总裁兼分析师Marco Meinardi表示，以往企业成本主要由内部用户和系统决定，但AI成本还会受到客户如何使用AI应用、输入何种提示词等因素影响。换言之，客户的使用方式本身也会改变企业成本结构，因此这一问题需要不同于传统IT支出的解决方案。

Chi-gyu Hwang delight@d-today.co.kr