企业正重新分配不同任务对应的AI模型。图片来源:Shutterstock

美国企业正在重新计算AI投入产出比。随着预算约束趋严,越来越多公司开始引入“模型路由”机制:不再把所有任务一股脑交给最强、也最贵的模型,而是按任务复杂度分层调用不同模型,以控制成本、提升效率。

据CNBC当地时间6月5日报道,这一做法正在企业端快速扩散。具体而言,复杂度高、对准确性和推理能力要求更高的任务,仍由高价前沿模型处理;而大量简单、重复性的工作,则转向更便宜、响应更快的模型。

这一变化背后,首先是企业内部对AI支出的审视明显加强。越来越多首席财务官和董事会开始追问:是否所有工作都必须调用最昂贵的模型?过去,不少企业默认直接采用性能最强的模型,但随着实际账单持续超出预期,优化AI成本结构已成为新的管理重点。

Cognition首席执行官Scott Wu表示,在重复性任务中,模型分层带来的降本效果尤其明显。按他的说法,对于标准化工作,采用“够用即可”的模型,成本效率可提升5倍至10倍。他举例称,像“美国第三任总统是谁”这样的简单问题,无论使用高价模型还是低价模型,答案都是Thomas Jefferson,因此没有必要长期为此支付更高成本。

不过,从目前情况看,企业对模型路由的部署仍处于早期阶段。Glean首席执行官Arvind Jain估算,企业约95%的AI使用量仍运行在最昂贵的前沿模型上。这意味着,原本可以由低成本模型完成的大量任务,仍在以高成本方式处理。

成本压力同样出现在大型科技公司内部。Cisco首席产品官Jeetu Patel表示,如果按员工人均每周产生约200美元的Token成本计算,一年约为1万美元左右;对于拥有9万名员工的企业而言,年成本可达9亿美元。Cisco称,公司约有3万名工程师正在开发大量由AI参与编写的产品,但相关支出已明显超出原有预算,因此不得不重新调整资源配置。Patel还表示,在重新编制预算时,公司已将Token支出放在更优先的位置。

面对客户对投入产出比的担忧,AI厂商也开始调整应对方式。Cognition推出“AI生产力保障”计划:如果Devin创造的工程价值低于客户支付金额,公司将在最高1000万美元额度内承担相关使用成本,直到产出达到相应水平。Scott Wu表示,这一举措正面回应了当前行业最核心的争议——ROI。他指出,评估AI价值不能只看Token消耗量或代码行数等“活动指标”,更应关注AI究竟为工程师节省了多少时间。“即便消耗了数十亿Token,也可能什么都没有完成。”

这一趋势也可能对OpenAI、Anthropic等前沿模型厂商带来压力。如果企业把大量简单任务转向中国等市场提供的低价开源模型,高价模型就很难继续覆盖所有场景并维持原有收益水平。即便这些厂商仍能在高难度、复杂任务上保持溢价,其可覆盖的整体工作量占比也可能收缩。

不过,这并不意味着前沿模型本身失去价值。Patel认为,最先进的技术依然有其定价基础,但价格体系可能需要调整。按他的说法,研究机构和模型厂商不能只靠提价来应对成本压力,更需要让模型的使用方式变得更高效。

整体来看,企业关注的重点正从“AI成本上升后是否还要继续投入”,转向“如何以更聪明的方式使用AI”。随着这一变化持续推进,AI定价的话语权也可能部分从高端模型供应商转向企业客户。未来,前沿模型或仍能在最复杂的任务上获得溢价,但简单任务向低成本模型迁移的速度,将成为影响主要AI公司后续增长与估值的重要变量。

关键词

#模型路由 #AI预算 #OpenAI #Anthropic #Cisco #Cognition #Glean #Devin #Token成本 #低价开源模型
版权所有 © DigitalToday。未经授权禁止转载或传播。