Claude Code代码泄露引发关注：AI代理或令内存与半导体需求超预期

Anthropic旗下AI编程代理Claude Code因内部源代码意外泄露，引发市场对AI基础设施需求的新一轮讨论。业内认为，此次暴露出的技术细节显示，AI代理对内存及相关半导体的消耗，可能高于此前预期。

3月31日，美国安全公司Fuzzland CTO Chaofan Shou披露，其在npm仓库发布的Claude Code 2.1.88安装包中发现了用于内部调试的source map（源映射）文件，且相关文件被一并打包对外公开，导致约51.2万行代码可被查看。Anthropic回应称，泄露文件不包含客户数据或访问凭证，这并非安全入侵事件，而是打包流程中的人为失误。

从已泄露代码披露的信息来看，Claude Code在不执行任务的空载状态下，内存占用约为15GB；在用户实际使用的活跃状态下，最高可达到空载时的8至9倍。值得注意的是，这一数据来自开发者使用的单台PC，而非服务器环境。

较高的内存消耗，与其功能架构密切相关。Claude Code接收用户的自然语言请求后，会先由AI判断需要调用哪些工具；在完成权限确认后，再执行相应操作，并将结果返回给模型，随后继续进入下一轮判断与执行。整个流程并非一次性响应，而是持续循环的执行链路。

泄露代码还显示，系统中设计了名为KAIROS的功能，可在无需用户持续介入的情况下于后台运行，可视为一种常驻式代理机制。这意味着，即便用户暂时离开，Claude Code仍可能继续执行任务，并持续占用内存资源。

此外，AutoDream功能会在用户休息期间积累工作记录后，额外启动一个Claude会话进行整理。也就是说，即使用户没有直接操作，系统仍会为归纳和整理这些内容额外发起推理计算；整理粒度越细，对算力和内存的占用也会随之增加。

代码还显示，Claude单次可处理的对话量已提升至原来的5倍。对话量扩大，意味着用于临时存储的服务器内存需求也将同步上升。若再叠加单个用户同时运行5至15个代理的多代理架构，以及KAIROS带来的常驻会话机制，单个用户对应的内存消耗增幅，可能快于用户规模本身的增长。

这一变化，也与Nvidia和Arm近期强化CPU布局的方向形成呼应。

此前，市场对AI内存需求的讨论，更多集中在H100、B200等高带宽内存（HBM）及服务器侧基础设施，相关测算大多基于用户数量线性增长的假设。但如果AI应用从传统问答型模型，进一步走向具备执行能力的代理形态，实际内存需求可能明显高于既有估算。

早期生成式AI主要以“问答型”交互为主，算力瓶颈更多集中在GPU计算环节。而以Claude Code为代表的AI代理，其负载已演变为多层执行结构：系统不仅要理解请求，还要调用外部工具、执行任务、回收结果，并据此继续作出下一步决策。

在这一过程中，任务编排、数据库访问、外部工具调用、会话管理以及内存管理等环节，主要由CPU承担。GPU负责模型推理本身，CPU则负责调度整体执行流程，确保各项计算按正确顺序、基于正确数据完成。此次泄露代码中出现的KAIROS与AutoDream，正是这一多层结构的具体体现。

Yujin Investment & Securities指出，Nvidia已将Vera Rubin Pod定位为数据中心集群机架系统方案。以NVL72机架为基准，CPU占比为33%；而在VR Pod中，这一比例提升至49%。与此同时，Nvidia单独推出Vera CPU机架，也被市场解读为针对AI代理扩散后可能出现的内存瓶颈进行布局，反映出CPU重要性正在上升。

Arm方面也宣布，计划以机架系统形式提供AGI CPU。Yujin Investment & Securities援引Arm预测称，随着AI代理市场走向成熟，到2030年，数据中心CPU市场规模将达到1000亿美元（约144万亿韩元）。Arm同时预计，未来5年内，AGI CPU年营收将达到150亿美元。

Suk Dae-gun d2dg@d-today.co.kr

关键词