生成式AI Token计费持续走高，短期内难降

生成中...

Chi-gyu Hwang

发布时间 2026-05-25 08:56:39

搜索关键词

企业部署生成式AI应用和服务的成本持续走高，市场对相关支出压力的担忧也在升温。

业界原本期待新一代GPU和AI加速器能够拉低推理成本，但市场也越来越担心，这部分降本红利短期内未必会传导至用户侧。

据The Register近日报道，原本希望以更低成本用AI替代部分人力的企业管理层，正面对更为严峻的现实。

Claude Code、Codex、GitHub Copilot等编程类AI，被视为生成式AI最具代表性的商业化落地场景之一。问题在于，围绕模型训练建设的数据中心，并非按海量用户并发调用服务的场景设计，训练与推理本就是两种截然不同的工作负载。

报道指出，Nvidia以200亿美元收购AI芯片初创公司Groq的消息，也从侧面反映出行业对这一问题的重视。AMD、AWS、Intel、Google等厂商也在重新设计GPU和AI加速器，以降低单个Token的处理成本。不过，这类硬件大多计划在2026年下半年发布，要实现大规模部署，最快也要等到2027年初至年中。

在这一背景下，模型厂商也开始测试用户对提价的承受度，观察在价格上调后，用户是否仍会继续使用相关服务。

OpenAI在发布GPT-5.5的同时，已将Token价格上调至原先的两倍：输入价格升至每100万Token 5美元，输出价格升至每100万Token 30美元。Google也加入提价行列，新发布的Gemini Flash 3.5定价较上一代高出3倍至6倍。

The Register指出，相比普通聊天机器人，Agent类工具的Token消耗量可高出数十倍，这也进一步放大了提价带来的成本压力。

Microsoft已取消GitHub Copilot按席位收费模式，转向按使用量计费；Anthropic也在重新评估其定价体系。

按The Register的测算，使用AI执行任务的成本约为每小时30美元；而雇佣员工的时薪约为40美元，此外还需承担福利等支出。也正因如此，AI厂商仍可用“比雇人更便宜”的逻辑维持高价。未来，AI服务甚至可能不再按Token计费，而是按“替代一名全职员工的成本”来定价。

至于市场竞争是否会压低价格，The Register同样持谨慎态度。报道指出，主要模型开发商目前普遍处于亏损状态，可压缩的利润空间相当有限。

Chi-gyu Hwang delight@d-today.co.kr