一家企业在向全体员工开放生成式AI后,短短一个月内就产生了高达5亿美元(约7540亿韩元)的使用费用。这一案例曝光后,企业如何管理AI成本再次成为市场关注的焦点。
据区块链媒体BeInCrypto于5月29日(当地时间)报道,这家要求匿名的企业将Anthropic的AI模型Claude面向全员开放,但并未设置个人使用额度或整体预算上限,最终导致费用快速失控。
问题的核心在于,生成式AI采用按量计费模式,而一旦在企业内部大范围铺开,Token消耗就会随使用量同步放大。在缺乏限制的情况下,员工使用频率迅速上升,相关成本也随之大幅攀升。
其中,重度用户带来的费用增长尤其明显。报道称,部署Agent工作流或进行大规模代码生成的工程师,单人每月就可能产生数百至数千美元的费用;若让能够自主执行重复任务的AI Agent全天候运行,成本上升速度还会更快。
近期,Agent型AI和“扩展思考”(Extended Thinking)功能被业界视为新的生产力工具,但与此同时,这类能力也被认为是Token大量消耗的重要来源。与普通问答不同,这类应用通常需要反复执行多步骤流程,即便处理同一项任务,也会占用更多算力资源。
这一事件之所以引发广泛关注,也在于类似问题并非个案。报道提到,Microsoft在工程师人均月度AI成本升至500至2000美元后,已缩减内部Claude代码许可。网约车公司Uber也被指截至2026年4月已消耗掉大部分AI预算。Uber首席运营官Andrew Macdonald表示,在当前企业AI使用模式和业务优先级之下,证明相关投入的产出回报正变得越来越困难。
Amazon同样面临类似情况。该公司曾推出内部AI使用排行榜,但部分员工为了提升排名,反复输入与生产力无关的简单提示词,最终这一项目被叫停。公司认为,虽然使用量上升,但并未转化为实际业务产出,反而抬高了基础设施成本。
业内人士指出,不少企业误以为生成式AI与传统SaaS(软件即服务)一样,属于固定订阅成本,这正是问题的重要根源之一。实际上,模型类型、提示词长度以及是否启用Agent功能,都会显著影响最终费用,但许多企业普遍低估了这套成本结构的复杂性。
Anthropic虽然提供管理员控制台、按用户设置使用上限以及合规管理等企业级控制工具,但这些功能需要企业自行配置。报道称,在上述案例中,相关控制措施几乎没有被启用。
在这样的背景下,企业关注重点正从“扩大部署”转向“控制成本”。越来越多公司开始引入单用户支出上限、基于角色的访问权限管理、实时成本监控系统,并在处理简单任务时优先使用成本更低的模型。
目前,Claude仍在快速扩张,已获得数百家年支出超过100万美元的企业客户。不过,业界认为,这起事件也再次说明,生成式AI既可能成为提升效率的工具,也可能在治理缺位时演变为新的预算风险。