Coinbase表示,尽管人工智能(AI)Token消耗呈指数级增长,但公司通过将不同请求分配给成本更低的模型处理,整体成本基本保持稳定。
据Business Insider当地时间8日报道,Coinbase首席执行官Brian Armstrong日前在X(原Twitter)发文称,公司通过更合理地分配提示词、并按任务进行调度,把AI相关支出控制在相对稳定的区间内。
这一表态也呼应了近期AI行业对成本效率问题的再次关注。市场普遍认为,Opus4.8、GPT-5.5等新一代模型虽然性能更强,但Token消耗也可能更高。此前,Anthropic发布Opus4.7时,也有部分用户对其使用额度提出质疑。这意味着,随着高性能模型关注度持续上升,企业在实际运营中如何针对不同任务选择不同模型,正成为成本管理的重要课题。
在Armstrong看来,这一成本结构未来还会更快重塑。他预计,未来12至18个月内,约80%的工作将由成本低99%的模型完成。与此同时,最新一代模型不会成为所有人随时调用的通用工具,而更可能集中用于少数需要高强度推理的任务。他举例称,科学创新、智能体编排等场景,可能更需要这类高性能模型。
市场对此看法不一,但对“按任务使用不同模型”的方向已形成一定共识。风投人士Marc Andreessen评价称“很有意思”。Box首席执行官Aaron Levie则认为,Armstrong给出的数字“有些极端”,但他同样判断,未来AI应用很可能进一步分化:高难度任务由头部模型承担,大规模、重复性工作则交给低成本模型处理。
与此同时,此前“不必节省Token”的行业氛围也开始出现降温迹象。过去一段时间,科技行业一度流行炫耀高Token成本或最新模型使用量,尤其在初创公司圈层,“没必要省Token”的观点并不少见。Y Combinator首席执行官Garry Tan曾建议创业者积极使用Token;初创公司创始人Lance Yano也曾在今年4月表示,节省Token“很愚蠢”。
不过,近期市场风向正逐步转向“根据成本和任务属性分配模型”。Glyn联合创始人Tony Gentilcore评价Armstrong的观点“准确”,并称“科技从业者其实早就知道这一点”。他还指出,把Opus的价格简单线性外推到无限规模的做法,“只存在于金融市场”。
随着企业将AI更快接入真实业务场景,除了追逐最新模型之外,如何以更合理的成本结构处理不同类型的任务,正成为影响AI落地效果的关键运营变量。