KAIST与Korea University联合开发可在不同AI模型之间高效迁移已学习适配知识的新技术。图为AI生成的知识迁移示意图。图片来源:KAIST

KAIST于27日表示,该校计算机学院Hyunwoo Kim教授团队与Korea University研究团队联合开发出一项新技术,可在不同AI模型之间高效迁移已学习的适配知识。

近期,能够同时理解图像与文本的视觉语言模型(VLM)发展迅速。这类模型经过海量图文数据预训练后,只需少量数据便可较快完成新领域适配。

不过,每有新模型出现,往往都要重新进行适配训练,整体效率偏低。现有适配方案也存在明显局限:一旦模型结构略有差异,既有经验便难以直接复用;有些方法还需要同时调用多个模型,进一步推高内存和算力开销。

为解决这一问题,研究团队提出了名为TransMiter的可迁移适配方法。其核心在于,将模型在适配过程中形成的经验迁移到其他AI模型上。该方法无需改动模型复杂的内部结构,而是通过预测结果传递已学习的适配策略。

这意味着,即使模型架构和规模不同,只要围绕同一任务的输出结果进行整理,一个模型学到的适配经验也可以直接用于另一个模型,从而省去重复且耗时的训练过程,同时几乎不影响运行效率。

研究团队表示,这项研究首次证明,过去被认为在模型结构或规模不同的情况下几乎无法复用的AI适配知识,也能够突破模型类型限制,实现高精度迁移。团队还预计,该技术未来可作为“知识补丁”使用,用于降低重复训练成本,并按需对大语言模型进行实时更新。

Hyunwoo Kim表示,如果进一步拓展这项研究,有望显著降低超大规模语言模型在快速迭代过程中反复进行后训练的成本,同时以更便捷的方式为模型打补丁,轻松引入特定领域的专业知识。

本项研究由KAIST计算机学院硕士生Taehun Song、博士后研究员Sanghyeok Lee,以及Korea University博士生Jihwan Park共同参与。相关成果已入选人工智能国际学术会议AAAI 2026口头报告。

除上述论文外,Hyunwoo Kim教授团队此次还公开了另外两篇论文,其中包括与Google Cloud AI联合推进的文档内表格理解强化技术TabFlash。

关键词

#KAIST #Korea University #TransMiter #适配知识迁移 #模型适配 #视觉语言模型 #大语言模型 #AAAI 2026 #TabFlash
版权所有 © DigitalToday。未经授权禁止转载或传播。