图片来源:Shutterstock

企业部署生成式AI应用和服务的成本持续走高,市场对相关支出压力的担忧也在升温。

业界原本期待新一代GPU和AI加速器能够拉低推理成本,但市场也越来越担心,这部分降本红利短期内未必会传导至用户侧。

据The Register近日报道,原本希望以更低成本用AI替代部分人力的企业管理层,正面对更为严峻的现实。

Claude Code、Codex、GitHub Copilot等编程类AI,被视为生成式AI最具代表性的商业化落地场景之一。问题在于,围绕模型训练建设的数据中心,并非按海量用户并发调用服务的场景设计,训练与推理本就是两种截然不同的工作负载。

报道指出,Nvidia以200亿美元收购AI芯片初创公司Groq的消息,也从侧面反映出行业对这一问题的重视。AMD、AWS、Intel、Google等厂商也在重新设计GPU和AI加速器,以降低单个Token的处理成本。不过,这类硬件大多计划在2026年下半年发布,要实现大规模部署,最快也要等到2027年初至年中。

在这一背景下,模型厂商也开始测试用户对提价的承受度,观察在价格上调后,用户是否仍会继续使用相关服务。

OpenAI在发布GPT-5.5的同时,已将Token价格上调至原先的两倍:输入价格升至每100万Token 5美元,输出价格升至每100万Token 30美元。Google也加入提价行列,新发布的Gemini Flash 3.5定价较上一代高出3倍至6倍。

The Register指出,相比普通聊天机器人,Agent类工具的Token消耗量可高出数十倍,这也进一步放大了提价带来的成本压力。

Microsoft已取消GitHub Copilot按席位收费模式,转向按使用量计费;Anthropic也在重新评估其定价体系。

按The Register的测算,使用AI执行任务的成本约为每小时30美元;而雇佣员工的时薪约为40美元,此外还需承担福利等支出。也正因如此,AI厂商仍可用“比雇人更便宜”的逻辑维持高价。未来,AI服务甚至可能不再按Token计费,而是按“替代一名全职员工的成本”来定价。

至于市场竞争是否会压低价格,The Register同样持谨慎态度。报道指出,主要模型开发商目前普遍处于亏损状态,可压缩的利润空间相当有限。

关键词

#生成式AI #Token计费 #推理成本 #GPU #AI加速器 #OpenAI #GPT-5.5 #Google #Gemini Flash 3.5
版权所有 © DigitalToday。未经授权禁止转载或传播。