KT发布韩语及韩国文化语境多模态AI安全评测基准KSAFE-MM

KT发布了一项面向韩语及韩国文化语境的多模态人工智能(AI)安全评测基准,用于评估模型在文本、图像、语音等多种输入场景下的安全风险。

KT于16日宣布,与Korea University联合开发并发布的多模态大模型(MLLM)安全评测基准KSAFE-MM已正式公开。

据介绍,KSAFE-MM是一套针对韩语及韩国文化语境构建的数据集,主要用于测试能够综合处理文本、图像、语音等多类数据的多模态AI模型的安全性。该基准由两部分组成:KSAFE-MM-G聚焦全球通用风险场景,并进行韩语及本土文化语境适配;KSAFE-MM-C则纳入韩国社会特有议题,例如租房诈骗、独岛争端等。

该基准共包含14135个评测样本。KT与Korea University研究团队已基于这一基准,对包括Gemma、HyperCLOVA X在内的12款全球多模态大模型进行了安全评估。

与此同时,研究团队还搭建了一套从数据采集到测试样本生成的通用自动化流程,以解决现有安全基准高度依赖人工审核、构建成本高且周期长的问题。该流程共分四个阶段,涵盖基于本地社区内容的敏感议题收集、基于模板的查询生成、合成图像生成以及越狱查询生成等环节。

KT表示,借助这套方案,即使缺乏特定文化圈专家,也能够较快构建体现本土特征的安全评测基准。研究团队还将同一流程应用于日语场景,完成了JSAFE-MM-C的试点实验,以验证其向其他文化圈扩展的可行性。

目前,相关研究成果及基准已在预印本平台arXiv和开源社区Hugging Face公开。

KT AX未来技术院Frontier AI Lab负责人Park Jaehyung表示,公开这一安全评测基准,旨在为AI安全研究生态发展夯实基础,并希望KSAFE-MM能够成为学界和产业界检验韩语及韩国文化语境下AI安全性的通用标准。

关键词

#KT #KSAFE-MM #多模态大模型 #MLLM #AI安全 #安全评测基准 #数据集 #Korea University #Gemma #HyperCLOVA X #Hugging Face
版权所有 © DigitalToday。未经授权禁止转载或传播。