韩国政府推进的“自主AI基础模型”项目已进入第二轮评估阶段,围绕模型研发方向的讨论也随之升温。业界普遍认为,首轮评估主要聚焦是否具备“From Scratch(从零训练)”能力,而第二轮评估的竞争重点则可能转向多模态能力。
据业内消息,通过首轮评估的SK Telecom、LG AI Research、Upstage三支团队,正着手打造多模态AI基础模型。在完成“从零训练”能力验证后,各家竞争重心正逐步转向实际性能和落地可用性。
SK Telecom在首轮评估中推出了参数规模达519B的大语言模型(LLM)AX. K1。该模型在高难度数学和编程任务中表现较强。SK Telecom计划进一步提升AX. K1的多模态能力,使其能够处理语音和视频数据,以增强模型可用性,并在第二轮评估中巩固竞争力。
SK Telecom相关人士表示,团队将在第二轮评估阶段先从图像数据着手,逐步扩展多模态能力;同时还将扩大训练数据规模,并把训练语言增至5种。
LG AI Research也被认为正以构建多模态模型为目标持续推进研发。Upstage此前也曾在面向公众的发布会上表示,后续将推进多模态能力建设。
多模态能力同样与该项目强调的公共服务场景落地能力直接相关。无论是基于语音的民众诉求响应、视频数据分析,还是文档与图像的一体化处理,都被视为具备应用空间。有业内人士指出,当前竞争的关键已不再只是“能否自主研发模型”,而是“能否展现差异化性能和实际可用性”;在这一背景下,多模态或将成为体现公共服务适配能力的重要抓手。
如果上述三支入围团队在第二轮评估中全面展开多模态竞争,那么参与新增遴选的企业能否跟上节奏,也将成为新的看点。韩国科学技术信息通信部在首轮评估结束后调整了方案,决定在淘汰2支团队的同时,另行增选1支团队。
目前,KT、Kakao、Naver等大型企业均已决定不参与新增遴选。Motif Technologies与Trillion Labs两家初创公司则明确表示将加入竞争。Motif Technologies强调,其在高性能LLM和多模态基础模型开发方面同时具备经验优势;Trillion Labs则将模型的自主性与可控性作为核心卖点。
业内还认为,第二轮评估可能成为该项目竞争格局变化的重要节点。若首轮评估更侧重“自主性”验证,那么第二轮评估则有望更清晰地呈现各团队的技术路线。多模态能力在实际评估中将占据多大比重,也因此成为市场关注焦点。
有业内人士表示,第二轮评估将成为观察各入围团队如何提升模型能力、并验证后续应用方案的关键阶段。