SK Telecom正与NVIDIA加快推进AI基础设施合作,并计划基于NVIDIA平台建设面向AI业务的“AI工厂”,未来逐步扩展至GW(吉瓦)级规模。
SK Telecom表示,SK集团会长Chey Tae-won本月初在中国台湾与NVIDIA首席执行官Jensen Huang会面,双方就AI基础设施路线图进行了讨论,并同意在集团层面推进合作。此后,Jensen Huang于本月5日、7日和8日访问韩国期间,Chey Tae-won又与其多次会面,再次确认合作意愿。
瞄准推理算力需求增长,AI工厂成合作核心
此次合作的核心是“AI工厂”。这一概念指的是以电力和数据为基础投入、以生成式AI的基本单元Token为目标的新型数据中心。近年来,Jensen Huang多次在公开场合将AI工厂定位为下一代产业基础设施,这一表述也逐渐成为行业通用概念。
SK Telecom将成为此次合作的主要执行方。公司计划依托NVIDIA DSX平台,于明年启动AI工厂项目。与主要承担通用计算和数据存储功能的传统数据中心不同,AI工厂更聚焦于AI模型训练、推理以及大规模数据处理。按照规划,SK Telecom将整合子公司SK Broadband的数据中心运营能力,并结合NVIDIA的GPU、网络和软件资源,目标是成长为亚洲具有代表性的AI云服务提供商。
这一布局也契合AI产业重心由训练向推理加速转移的趋势。Deloitte预测,到2026年,AI模型在实际服务中的推理算力需求预计占全球AI算力需求的约三分之二。SK Telecom希望借助AI工厂,满足韩国国内快速增长的AI推理基础设施需求,并在后续将项目规模扩大至GW级,进一步将业务拓展至亚洲市场。
有AI行业人士表示,如果GW级基础设施最终落地,SK Telecom有望成为韩国规模最大的AI基础设施运营商,其从传统通信企业向综合性AI企业转型的步伐也将进一步加快。
SK Telecom认为,公司已经具备推进“AI全栈”落地的能力。所谓“AI全栈”,是指覆盖芯片、网络、数据中心、云平台,以及AI模型和服务在内的完整技术与能力体系。
SK Telecom表示,公司已凭借多项解决方案获得技术层面的认可。在加山AI数据中心,SK Telecom正在运营GPUaaS集群“Haeyin”。该集群由1000多块NVIDIA Blackwell B200 GPU组成,并于今年获得GSMA全球移动大奖。与此同时,公司还通过政府推动的自主基础模型项目,构建了“A.X K1”等自研AI模型能力。
从芯片到运营协同布局,Token生产效率成关键指标
在业内看来,与NVIDIA的合作有望成为SK Telecom向AI云整体设计和运营服务商升级的重要契机。原因在于,AI工厂建设并不仅仅依赖GPU,还需要高速网络、存储设备、电力供应、冷却设施以及运维软件等环节协同配合。
市场也对SK集团层面的协同效应抱有较高期待。如果能够打通SK hynix的HBM、SK Broadband的数据中心能力,以及SK Telecom的AI云和模型能力,SK集团将形成从半导体到基础设施运营与服务的完整AI价值链。随着与Amazon Web Services(AWS)合作的蔚山AI数据中心,以及与OpenAI合作的西南圈AI数据中心陆续投入运营,SK集团在AI基础设施建设和运营方面的能力预计也将进一步提升。
不过,推进GW级AI工厂仍面临多重现实挑战,其中包括稳定供电以及大规模资本投入带来的压力。与此同时,随着新一代GPU加速迭代,设备更新和折旧负担也可能进一步上升。项目建成后,如何获得足够客户并维持较高利用率,同样是必须解决的现实问题。
业内人士指出,AI数据中心的关键并不只是“建成”,更在于能否持续保障电力供应,并锁定稳定的客户需求。能否走出韩国国内市场,吸引全球企业以及国家层面的AI基础设施项目需求,将在很大程度上决定项目成败。