韩国媒体日前刊文指出,韩国若要推动“主权AI”落地,不能只依赖大规模GPU集群,还需同步培育本土NPU生态。尤其在AI应用加快从训练转向推理的背景下,地方分布式推理节点和微型数据中心或将成为本土AI芯片进入真实市场的重要突破口。
文章提到,去年10月,Nvidia宣布将向韩国供应26万块GPU。这一消息一度被视为韩国冲刺“全球AI三强”的成果之一。不过,从实际流向看,这批GPU资源高度集中于大企业。其中国内主要企业分别将相关算力用于HBM和晶圆代工良率优化、自动驾驶仿真、自建AI工厂及云业务运营等场景。
相比之下,真正能够分配给产学研机构和初创企业的资源比例并不高。文章称,在国家政策层面,可用于相关主体的规模约占总量的20%。韩国还通过1.46万亿韩元追加预算,先行落实1.3136万块GPU,但实际采购和运营主体是Naver Cloud、NHN Cloud和Kakao三家公司,政府则以租赁方式使用其算力资源。
分配给产学研机构的资源,本质上也主要是上述三家数据中心提供的虚拟化切片。单个课题最长支持周期为12个月,产业界还需按市场价格承担5%至10%的费用。文章认为,这种安排虽然能够缓解部分算力需求,但并不足以支撑本土AI芯片和生态体系的长期成长。
从设备类型看,政府已落实的H200、B200均属于高性能GPU,更适合模型训练和大规模通用计算。H200 SXM最高功耗约700W,B200系列对供电和散热基础设施的要求则更高。这类设备适合将数百块乃至数千块GPU集中部署,用于大模型训练。文章指出,大模型训练和国家级科研当然离不开大型GPU集群,但若试图以同一种基础设施承载所有AI需求,现实中并不容易实现。
文章进一步指出,AI工作负载的重心正在迅速向推理端转移。随着智能体、垂直行业AI、物理AI以及受区域监管约束的AI应用不断增加,真正关键的能力已不再只是超大规模训练,而是低时延、低功耗的推理能力。
在医院、工厂、港口、产业园区、学校和交通管制等一线场景中,数据往往在本地产生,也需要尽可能在本地完成判断和响应。文章认为,这类需求很难全部回传至中心节点统一处理。随着推理专用芯片逐步普及,韩国本土企业FuriosaAI、Rebellions也已推出NPU产品,围绕LG AI Research、KT Cloud及SK数据中心的实际导入案例也在增加。
不过,与海外GPU和NPU相比,韩国本土NPU在性能、通用性和软件生态方面仍存在差距,开发者体验较弱,可支持的模型和框架也相对有限,在大规模训练或通用AI算力场景中难以正面竞争。文章强调,也正因为如此,政策设计才更为关键;如果只有保护和投资,而缺少真实业务环境中的持续验证,本土NPU很难真正成长起来。
文章认为,本土NPU必须在真实客户、真实故障、真实成本和真实SLA环境中接受检验。只有持续对接医院影像判读、工厂异常检测、地方政府CCTV分析、交通管制、民政自动化、学校学习数据处理等现场推理需求,芯片、驱动、编译器以及整个生态体系才有可能不断迭代完善。
在这一背景下,如果政府以市场价格5%至10%的成本大规模提供Nvidia GPU,初创企业自然会优先选择成熟的GPU方案,尝试尚未成熟的本土NPU的动力也会随之下降。对本土NPU厂商而言,这意味着其更难获得接受市场检验、建立竞争力所必需的窗口期。
文章还提到,全罗南道海南SolarCity国家AI计算中心项目已启动建设。按规划,该项目将于2028年前分阶段建设1.5万块GPU,并在2030年前扩大至5万块,总投资达2.4065万亿韩元。不过,在两次流标后,项目的公共持股比例已由51%降至30%以下,原先要求强制搭载本土NPU的条款也被删除。
从项目结构看,该项目已更接近由大型企业财团主导的商业化基础设施。与之相比,微型数据中心项目预算仅为273亿韩元。文章认为,在“兆韩元级”集中式基础设施面前,分布式、小规模基础设施在政策资源配置中的权重明显偏低。
文章指出,韩国政府虽强调“主权AI”,但在现有结构下,所谓“主权AI”很可能只是“把Nvidia芯片部署在韩国境内”。而真正的数据主权并不止于设备所在地,更在于地方制造工艺数据、区域医疗机构影像数据、地方政府CCTV数据、学校学习数据和产业园区设备数据,能否在数据产生地附近完成处理与应用。
基于这一判断,文章提出,将公共闲置资产、先进出行基础设施与分布式推理节点结合,或许是一条可行替代路径。文章称,韩国累计停办学校已超过4000所,其中闲置校舍仍有数百处;老旧产业园区到2025年也已增至约520处。如果从中筛选出具备电力、通信和交通可达性的点位,就有机会成为区域型AI基础设施候选地。
文章认为,闲置校舍和老旧产业园区可以复用既有公共用地及部分基础设施,有助于降低新增用地成本。虽然这些地点仍需补强数据中心级别的供电、制冷和通信能力,但与从零开始建设大型中心相比,起点显然并不相同。
文章还提出,可将UAM垂直起降场(Vertiport)纳入整体规划。这类设施不仅承担起降功能,还会带来实时调度、路径优化、避碰和异常接近探测等低时延AI需求。若能与分布式推理节点协同建设,就有望同步布局交通基础设施和AI基础设施。
具体而言,文章建议,在广域市层面建设5至10MW级节点,将垂直起降场、推理中心和初创企业部署于同一地点;在市、郡、区层面,利用闲置校舍和老旧公共用地建设1至3MW级节点;在社区层面,则可在图书馆和区政府附属空间部署100kW级集装箱式节点,形成分层体系,与中心化超大规模设施形成互补。
文章认为,如果在这些分布式推理节点中优先部署本土NPU,将同时打开两类市场:一方面,地方可以在本地处理本地数据;另一方面,本土AI芯片企业也能够获得真实需求。如果因为“性能不足”而将本土NPU完全排除在外,其短板只会长期固化;但如果不加区分地强制一线场景全面使用未经充分验证的技术,也可能适得其反。
因此,文章主张在两者之间寻找平衡,将区域推理节点打造为本土NPU的实战验证场。初期可采用GPU与NPU混合部署模式,公开比较不同工作负载下的性能、功耗和成本表现,先让本土NPU承担更具优势的应用场景,再推动其短板持续改进。文章强调,产业既不能靠单纯保护长大,也不可能在没有机会的情况下成长。
在政策执行层面,文章也指出了现实障碍。闲置校舍归教育部和各级教育厅管理,老旧产业园区涉及产业部门,垂直起降场归属国土部门,数据中心建设则由科学技术信息通信部门主导,区域均衡发展还涉及行政安全部门。由于项目横跨多个部门,在韩国现行行政体系下推进难度较大,这也被视为微型数据中心预算最终仅缩至273亿韩元的原因之一。
文章认为,在相关部门人手有限的情况下,中央政府很难同时规划并执行数十个地区的分布式基础设施建设。中央可以提供方向和预算,但要把地方用地、电力、许可和产业需求打包整合,并不完全属于中央权限范围。
正因如此,文章将地方选举候选人的作用置于重要位置。文章称,下一届地方政府不应止步于提出口号式承诺,而应将本地闲置资产与产业需求打包,主动向中央提出“反向提案”。
文章给出的理由主要有三点。首先,地方政府掌握闲置资产的所有和管理权限。无论是闲置校舍再利用,还是老旧产业园区更新改造用地,以及公共图书馆、区政府附属空间的调配,都需要地方推动,中央无法替地方直接“造地”。
其次,地方政府掌握需求整合能力。区域内医院、学校、产业园区、交通管制和行政数据,能否被整合为统一的AI工作负载,地方政府是核心主体。只有需求聚合起来,基础设施才有建设依据;基础设施形成后,企业才可能进一步集聚。
再次,地方政府也更有条件推动财团组建和项目落地。文章提出,如果由地方政府、区域大学、地方医院、产业园区、民间同址部署运营商以及本土NPU企业共同组建SPV,并作为中央招标的申报主体,项目的可执行性将更高。
文章还援引观点称,韩国商业数据中心长期高度集中在首尔及首都圈;即便从全部数据中心数量和电力需求口径来看,首都圈集聚现象依然十分明显。过去,地方往往只是在“均衡发展”的口号之下扮演被动角色,但这一局面在本轮周期中或许有机会改变。
文章最后总结称,单靠大型GPU去承载全部AI需求并不现实。尽管本土NPU目前仍有不足,但如果因这些不足而在实战市场中被长期边缘化,所谓追赶就无从谈起。技术差距不会只在实验室里缩小,更要通过接触客户、处理故障、压降成本、验证能效和打造易用生态,在真实市场环境中一步步缩小。
文章同时强调,中心化超大规模基础设施依然必不可少,大模型训练和国家级科研也离不开大型GPU集群;但若只有这一条路径,韩国AI产业很难真正做大。更可行的方向,是在各地铺设推理节点,为本土NPU建立面向市场的“实战赛道”,通过GPU与NPU混合部署、按工作负载比较性能、功耗和成本,并借助公共需求打开早期市场。文章认为,最有能力描绘并推动这一路径落地的,正是下一届地方政府首长。