Anthropic旗下AI编程代理Claude Code因内部源代码意外泄露,引发市场对AI基础设施需求的新一轮讨论。业内认为,此次暴露出的技术细节显示,AI代理对内存及相关半导体的消耗,可能高于此前预期。
3月31日,美国安全公司Fuzzland CTO Chaofan Shou披露,其在npm仓库发布的Claude Code 2.1.88安装包中发现了用于内部调试的source map(源映射)文件,且相关文件被一并打包对外公开,导致约51.2万行代码可被查看。Anthropic回应称,泄露文件不包含客户数据或访问凭证,这并非安全入侵事件,而是打包流程中的人为失误。
从已泄露代码披露的信息来看,Claude Code在不执行任务的空载状态下,内存占用约为15GB;在用户实际使用的活跃状态下,最高可达到空载时的8至9倍。值得注意的是,这一数据来自开发者使用的单台PC,而非服务器环境。
较高的内存消耗,与其功能架构密切相关。Claude Code接收用户的自然语言请求后,会先由AI判断需要调用哪些工具;在完成权限确认后,再执行相应操作,并将结果返回给模型,随后继续进入下一轮判断与执行。整个流程并非一次性响应,而是持续循环的执行链路。
泄露代码还显示,系统中设计了名为KAIROS的功能,可在无需用户持续介入的情况下于后台运行,可视为一种常驻式代理机制。这意味着,即便用户暂时离开,Claude Code仍可能继续执行任务,并持续占用内存资源。
此外,AutoDream功能会在用户休息期间积累工作记录后,额外启动一个Claude会话进行整理。也就是说,即使用户没有直接操作,系统仍会为归纳和整理这些内容额外发起推理计算;整理粒度越细,对算力和内存的占用也会随之增加。
代码还显示,Claude单次可处理的对话量已提升至原来的5倍。对话量扩大,意味着用于临时存储的服务器内存需求也将同步上升。若再叠加单个用户同时运行5至15个代理的多代理架构,以及KAIROS带来的常驻会话机制,单个用户对应的内存消耗增幅,可能快于用户规模本身的增长。
这一变化,也与Nvidia和Arm近期强化CPU布局的方向形成呼应。
此前,市场对AI内存需求的讨论,更多集中在H100、B200等高带宽内存(HBM)及服务器侧基础设施,相关测算大多基于用户数量线性增长的假设。但如果AI应用从传统问答型模型,进一步走向具备执行能力的代理形态,实际内存需求可能明显高于既有估算。
早期生成式AI主要以“问答型”交互为主,算力瓶颈更多集中在GPU计算环节。而以Claude Code为代表的AI代理,其负载已演变为多层执行结构:系统不仅要理解请求,还要调用外部工具、执行任务、回收结果,并据此继续作出下一步决策。
在这一过程中,任务编排、数据库访问、外部工具调用、会话管理以及内存管理等环节,主要由CPU承担。GPU负责模型推理本身,CPU则负责调度整体执行流程,确保各项计算按正确顺序、基于正确数据完成。此次泄露代码中出现的KAIROS与AutoDream,正是这一多层结构的具体体现。
Yujin Investment & Securities指出,Nvidia已将Vera Rubin Pod定位为数据中心集群机架系统方案。以NVL72机架为基准,CPU占比为33%;而在VR Pod中,这一比例提升至49%。与此同时,Nvidia单独推出Vera CPU机架,也被市场解读为针对AI代理扩散后可能出现的内存瓶颈进行布局,反映出CPU重要性正在上升。
Arm方面也宣布,计划以机架系统形式提供AGI CPU。Yujin Investment & Securities援引Arm预测称,随着AI代理市场走向成熟,到2030年,数据中心CPU市场规模将达到1000亿美元(约144万亿韩元)。Arm同时预计,未来5年内,AGI CPU年营收将达到150亿美元。