Arm首席执行官Rene Haas表示,随着Agentic AI加速落地,数据中心对CPU的需求增速正在超过Arm此前预期。根据台湾媒体IT Home报道,Haas在Computex主题演讲中称,在相同电力条件下,未来数据中心所需的CPU核心数可能增至当前的4倍以上。
Haas指出,过去两年,生成式AI相关投资主要集中在GPU,但Agentic AI的普及正在改变数据中心的算力需求结构。GPU主要承担训练和推理过程中的token生成,而Agentic AI除了生成答案,还需要持续执行任务、调用工具、管理工作流,并与其他代理协同工作。由此带来的调度、分发、协调和执行等负载,正越来越多地由CPU承担。
今年3月,Arm首次公开自研“Arm AGI CPU”,标志着公司在架构IP授权之外,进一步切入AI数据中心CPU产品市场。该产品基于Arm Neoverse架构和Compute Subsystem平台,面向大规模AI数据中心部署需求设计。
Haas还表示,Arm今年3月曾预测,未来5年CPU市场规模将超过1200亿美元,当时外界一度认为这一判断偏乐观。但随着市场对Agentic AI增长趋势的认知发生变化,这一预期也在被重新审视。他提到,随着OpenAI Codex、Anthropic、Salesforce、ServiceNow等将代理能力引入产品,CPU需求的增长速度也在高于此前预测。
在Arm看来,能效将是Arm AGI CPU的核心竞争力。公司数据显示,该产品的每瓦性能约为同级x86系统的两倍。在风冷系统下,36kW功耗可支持8160个CPU核心和超过180TB低延迟内存;在液冷系统下,200kW功耗可支持超过4.5万个核心和超过1PB内存。
Haas强调,AI数据中心的竞争焦点正在从芯片绝对性能,转向“每瓦算力”。他举例称,基于x86的17个2U服务器机架可容纳4352个核心,而采用Arm AGI CPU的30台1U服务器配置则可容纳8160个核心。Arm估算,大规模导入Arm架构CPU,可减少约10GW电力容量需求,并节省超过100亿美元基础设施投资。
目前,Arm AGI CPU已获OCI和ByteDance采用。与此同时,Google Axion、AWS Graviton、Nvidia Grace和Vera等数据中心CPU产品,也均基于Arm架构设计。
Agentic AI带来的变化也正向PC市场延伸。Nvidia日前发布的PC算力平台“Nvidia RTX Spark”搭载了由MediaTek定制的Grace CPU,同样基于Arm架构。Nvidia CEO Jensen Huang表示,PC将从“由人直接运行应用”的设备,转向“由代理执行任务”的算力平台。他还称,借助新的NVFP4模型压缩格式,未来PC可运行参数规模达1000亿的AI模型,从而使大量代理任务无需依赖云端,也能在终端设备上直接处理。