Coinbase CEO谈AI成本控制：高性能模型将只用于少数高推理任务

随着AI智能体加速普及，Token消耗问题受到更多关注。图片来源：Reve AI

Coinbase表示，尽管人工智能（AI）Token消耗呈指数级增长，但公司通过将不同请求分配给成本更低的模型处理，整体成本基本保持稳定。

据Business Insider当地时间8日报道，Coinbase首席执行官Brian Armstrong日前在X（原Twitter）发文称，公司通过更合理地分配提示词、并按任务进行调度，把AI相关支出控制在相对稳定的区间内。

这一表态也呼应了近期AI行业对成本效率问题的再次关注。市场普遍认为，Opus4.8、GPT-5.5等新一代模型虽然性能更强，但Token消耗也可能更高。此前，Anthropic发布Opus4.7时，也有部分用户对其使用额度提出质疑。这意味着，随着高性能模型关注度持续上升，企业在实际运营中如何针对不同任务选择不同模型，正成为成本管理的重要课题。

在Armstrong看来，这一成本结构未来还会更快重塑。他预计，未来12至18个月内，约80%的工作将由成本低99%的模型完成。与此同时，最新一代模型不会成为所有人随时调用的通用工具，而更可能集中用于少数需要高强度推理的任务。他举例称，科学创新、智能体编排等场景，可能更需要这类高性能模型。

市场对此看法不一，但对“按任务使用不同模型”的方向已形成一定共识。风投人士Marc Andreessen评价称“很有意思”。Box首席执行官Aaron Levie则认为，Armstrong给出的数字“有些极端”，但他同样判断，未来AI应用很可能进一步分化：高难度任务由头部模型承担，大规模、重复性工作则交给低成本模型处理。

与此同时，此前“不必节省Token”的行业氛围也开始出现降温迹象。过去一段时间，科技行业一度流行炫耀高Token成本或最新模型使用量，尤其在初创公司圈层，“没必要省Token”的观点并不少见。Y Combinator首席执行官Garry Tan曾建议创业者积极使用Token；初创公司创始人Lance Yano也曾在今年4月表示，节省Token“很愚蠢”。

不过，近期市场风向正逐步转向“根据成本和任务属性分配模型”。Glyn联合创始人Tony Gentilcore评价Armstrong的观点“准确”，并称“科技从业者其实早就知道这一点”。他还指出，把Opus的价格简单线性外推到无限规模的做法，“只存在于金融市场”。

随着企业将AI更快接入真实业务场景，除了追逐最新模型之外，如何以更合理的成本结构处理不同类型的任务，正成为影响AI落地效果的关键运营变量。

Yoonseo Lee yslee@d-today.co.kr

关键词