韩国政府推进的“独立AI基础模型”项目首轮评估出现意外结果,Naver Cloud未能入围。此次评审的争议焦点,集中在是否满足“From Scratch(从零构建)”要求。业界普遍预计,在后续评估中,“独立性”仍将是最核心的评判标准之一。
“From Scratch”成为首轮评估关键
“独立AI基础模型”项目是韩国为降低对海外AI模型依赖、应对技术、文化及经济安全风险而推进的国家级计划,目标是在与民生密切相关的领域建立可自主使用的AI模型体系,并为韩国跻身全球AI强国提供支撑。
从项目征集阶段开始,“独立性”就被列为核心要求。韩国科学技术信息通信部在指南中明确提出,所谓“独立AI基础模型”,并非基于海外模型微调形成的衍生模型,而是从模型设计到预训练流程均由本土自主完成的模型。换言之,即便模型性能达标,只要是在海外模型基础上简单改造,也不属于政策所界定的“独立AI”。
在这一标准下,“From Scratch”受到高度关注。其含义并不仅是自行训练模型,而是从数据采集、架构设计、训练算法到数据处理等环节,完成从模型规划到预训练的完整开发链条。由于政府将“独立性”置于突出位置,业界此前就普遍预期,“From Scratch”将成为重要评分项。
在此背景下,Naver Cloud的“HyperCLOVA X Seed 32B Think”因采用中国阿里巴巴开源AI模型“Qwen 2.4”的视觉编码器,引发是否符合“From Scratch”要求的争议。视觉编码器主要用于将图像、视频等信息转换为模型可处理的表征。
在AI模型开发中,权重通常被视为决定模型能力的核心参数。业界有观点认为,借用视觉编码器还可被理解为借用模型的“眼睛”或“耳朵”;但如果连权重一并采用,就不只是调用外部工具,而是实质性引入了其他模型的能力基础。
韩国科学技术信息通信部也据此认为,Naver Cloud采用中国模型权重,已偏离“From Scratch”的标准。Naver Cloud虽然通过了基准测试,但最终在“独立性”评估中失分。该部门在公布首轮评估结果时解释称,尽管使用开源模型已是行业普遍趋势,但即便如此,在权重初始化后自主训练,并在此基础上持续推进模型开发,仍是国内外产业界和学界普遍认可的独立AI模型基本条件。
高丽大学技术经营专业研究生院教授Lee Seong-yeop表示,从政府强调的Sovereign AI宗旨来看,该项目本就需要尽量避免技术依赖风险,因此主管部门作出这一判断并不令人意外。考虑到该计划旨在培育可应用于国家核心基础设施的AI模型,凡是存在外部模型使用争议的团队,在评审中通过的可能性本就较低。
业界呼吁进一步明确“独立”标准
不过,也有观点认为,如果连“仅借用架构”都被视为不符合“From Scratch”,这一标准未必合理。原因在于,开源利用已经成为行业趋势,而该项目又将性能目标设定为达到全球领先模型的95%。在不触及许可问题的前提下,适度借用海外模型,或许是更具现实性的路径。
庆熙大学大数据应用学系教授Lee Kyung-jeon指出,将“From Scratch”视为唯一核心标准,本身就值得重新审视,关键仍在于权属关系与控制权。从Sovereign AI的角度看,更重要的是对模型是否拥有自主可控能力,即能否自行修改并持续运营;只要能够确保这种控制权,就未必必须坚持全流程“从零构建”。
还有观点质疑,目前入围团队在“独立性”认定上本身也未必不存在边界问题。AI模型由训练数据、结构设计、推理方式和数据处理等多个要素共同构成。Lee Seong-yeop表示,政府有必要尽可能明确、具体地列出独立性认定标准,以减少后续争议。
在业界看来,Naver Cloud此次落选,释放出韩国“独立AI基础模型”政策执行力度较强的信号。随着评估进入下一阶段,围绕“独立性”的讨论很可能还会持续出现。多位业内人士认为,未来的竞争不仅要看性能,“独立性”也将继续成为重要评估维度。
此外,在首轮评估中,除Naver Cloud外,NC AI也未能入围,原因是未达到基准测试门槛。
按照最初“仅淘汰1支团队”的计划,韩国科学技术信息通信部将追加遴选1支团队,以4支入围团队进入第二阶段评估。Naver Cloud与NC AI均已表示不再参与后续竞争;此前在第一轮入围团队征集中落选的Kakao也已表态不参加。
业界预计,此前落选的KT、Motif Technologies、KONAN Technology等团队,再次参评的可能性较高。