图片来源:Reve AI

随着企业对AI的使用持续升温,相关成本也在快速攀升。如何在保证效果的前提下控制投入,正成为企业部署AI时的核心议题。

越来越多公司开始从多个环节压降AI成本。除了继续使用OpenAI、Anthropic等高性能模型外,不少企业也在根据具体任务混合调用价格更低的模型。与此同时,能够按照任务复杂度自动分配模型的“模型路由器”也受到更多关注。还有一些企业选择引入开源模型并进行定制,以进一步降低支出。

据The Information报道,开发AI客服代理的Fin过去主要使用Anthropic的Sonnet模型,但在一年多前开始转向基于open-weight模型的定制化自研AI。该公司表示,最近几个月这一转型明显提速。

Fin称,这一调整每年可节省数亿美元成本,并明显改善利润率。近期据报道,Salesforce已以36亿美元收购Fin。

除优化模型选择外,也有企业开始直接管理员工的AI使用规模。Meta和Uber等公司已着手为员工可使用的AI额度设置上限。此前,两家公司一度允许员工不限量使用AI,但由于相关支出超出预算,随后转向更严格的管控机制。

还有一些公司开始对员工可使用的模型进行分级管理。为了控制成本,企业会区分哪些岗位可以使用高价模型,哪些岗位只能使用成本更低的替代方案。

与此同时,业内还出现了一种更轻量的降本思路:减少模型在推理环节的额外计算开销,同样能够显著降低费用。

企业软件公司UiPath就正在借助提示工程,尽量压缩模型在执行任务前的“思考”消耗。该公司表示,这种做法尤其适用于重复性工作,在部分任务场景下可将成本降低90%以上。

即便如此,Anthropic和OpenAI高性能模型的使用量仍在快速增长。市场普遍认为,只要这些模型在性能上仍明显领先开源模型,就能够在一定程度上降低用户流失风险。不过在当前阶段,二者与开源模型之间的能力差距正在缩小。

尤其是在中国开源模型方面,市场评价也在发生变化。其定位已不再只是“便宜但勉强能用”,而是整体能力明显提升。部分基准测试结果甚至显示,一些开源模型的表现已经超过OpenAI或Anthropic的产品。

多模型接入平台OpenRouter表示,6月第二周由开源模型处理的Token占比已升至约65%,明显高于今年1月的34%和去年同期的26%。其中,中国的DeepSeek和MiniMax表现尤为突出。

OpenRouter还表示,过去开源模型的主要使用者多为小型AI初创公司,但近期大型企业的需求也在持续增加。

软件开发工具公司Factory Data于6月1日推出模型路由器后,也观察到了与OpenRouter相似的趋势。Factory称,开源模型使用量较上月激增3倍。Adobe、IT服务商Ypro以及支付公司Adyen等均在使用其模型路由工具。

与Anthropic等商用模型相比,转向开源模型带来的降本效果尤为明显。软件开发公司Inflectra首席执行官Adam Sandman表示,公司将部分业务从Anthropic模型切换至阿里巴巴开源模型Qwen后,其软件开发流程中用于图像和视频分析的相关产品功能,AI成本下降了99%。

美国最大加密货币交易所Coinbase也表示,在提升Token使用量的同时,公司借助中国开源模型将AI支出压缩了近一半。

Coinbase首席执行官Brian Armstrong称,公司已优先接入Z.ai GLM 5.2和Moonshot Kimi 2.7。

Armstrong还表示,公司正在让工程师更清楚地掌握各自的Token使用情况。工程师可以根据需要在不同模型上使用Token,但所有用量都会被可视化。他强调,企业的目标并不是单纯压低Token消耗,而是减少被浪费的Token;关键也不在于限制使用,而是建设一套能够支撑指数级增长的可持续基础设施。

在AI将进一步深入企业场景的背景下,AI成本管理的重要性预计还会继续上升。

也有观点指出,AI成本与云计算或SaaS支出的性质并不相同,因此需要采用不同的管理方式。

据SiliconANGLE报道,Gartner副总裁兼分析师Marco Meinardi表示,以往企业成本主要由内部用户和系统决定,但AI成本还会受到客户如何使用AI应用、输入何种提示词等因素影响。换言之,客户的使用方式本身也会改变企业成本结构,因此这一问题需要不同于传统IT支出的解决方案。

关键词

#AI成本控制 #模型路由 #OpenRouter #开源模型 #open-weight模型 #Anthropic #OpenAI #Fin #Coinbase #UiPath
版权所有 © DigitalToday。未经授权禁止转载或传播。