美国企业压缩AI预算，模型路由加速落地

美国企业正在重新计算AI投入产出比。随着预算约束趋严，越来越多公司开始引入“模型路由”机制：不再把所有任务一股脑交给最强、也最贵的模型，而是按任务复杂度分层调用不同模型，以控制成本、提升效率。

据CNBC当地时间6月5日报道，这一做法正在企业端快速扩散。具体而言，复杂度高、对准确性和推理能力要求更高的任务，仍由高价前沿模型处理；而大量简单、重复性的工作，则转向更便宜、响应更快的模型。

这一变化背后，首先是企业内部对AI支出的审视明显加强。越来越多首席财务官和董事会开始追问：是否所有工作都必须调用最昂贵的模型？过去，不少企业默认直接采用性能最强的模型，但随着实际账单持续超出预期，优化AI成本结构已成为新的管理重点。

Cognition首席执行官Scott Wu表示，在重复性任务中，模型分层带来的降本效果尤其明显。按他的说法，对于标准化工作，采用“够用即可”的模型，成本效率可提升5倍至10倍。他举例称，像“美国第三任总统是谁”这样的简单问题，无论使用高价模型还是低价模型，答案都是Thomas Jefferson，因此没有必要长期为此支付更高成本。

不过，从目前情况看，企业对模型路由的部署仍处于早期阶段。Glean首席执行官Arvind Jain估算，企业约95%的AI使用量仍运行在最昂贵的前沿模型上。这意味着，原本可以由低成本模型完成的大量任务，仍在以高成本方式处理。

成本压力同样出现在大型科技公司内部。Cisco首席产品官Jeetu Patel表示，如果按员工人均每周产生约200美元的Token成本计算，一年约为1万美元左右；对于拥有9万名员工的企业而言，年成本可达9亿美元。Cisco称，公司约有3万名工程师正在开发大量由AI参与编写的产品，但相关支出已明显超出原有预算，因此不得不重新调整资源配置。Patel还表示，在重新编制预算时，公司已将Token支出放在更优先的位置。

面对客户对投入产出比的担忧，AI厂商也开始调整应对方式。Cognition推出“AI生产力保障”计划：如果Devin创造的工程价值低于客户支付金额，公司将在最高1000万美元额度内承担相关使用成本，直到产出达到相应水平。Scott Wu表示，这一举措正面回应了当前行业最核心的争议——ROI。他指出，评估AI价值不能只看Token消耗量或代码行数等“活动指标”，更应关注AI究竟为工程师节省了多少时间。“即便消耗了数十亿Token，也可能什么都没有完成。”

这一趋势也可能对OpenAI、Anthropic等前沿模型厂商带来压力。如果企业把大量简单任务转向中国等市场提供的低价开源模型，高价模型就很难继续覆盖所有场景并维持原有收益水平。即便这些厂商仍能在高难度、复杂任务上保持溢价，其可覆盖的整体工作量占比也可能收缩。

不过，这并不意味着前沿模型本身失去价值。Patel认为，最先进的技术依然有其定价基础，但价格体系可能需要调整。按他的说法，研究机构和模型厂商不能只靠提价来应对成本压力，更需要让模型的使用方式变得更高效。

整体来看，企业关注的重点正从“AI成本上升后是否还要继续投入”，转向“如何以更聪明的方式使用AI”。随着这一变化持续推进，AI定价的话语权也可能部分从高端模型供应商转向企业客户。未来，前沿模型或仍能在最复杂的任务上获得溢价，但简单任务向低成本模型迁移的速度，将成为影响主要AI公司后续增长与估值的重要变量。

Jinju Hong hongjj@d-today.co.kr

关键词