KT光化门West办公楼外景(图片来源:KT)

KT 4日表示,公司自研大模型“Mi:um K”在全球AI模型综合评测平台AAII(Artificial Analysis Intelligence Index)中,位居韩国中小参数模型第一。

根据KT披露的信息,在此次评测中,“Mi:um K”在推理、专业知识、数学与编程,以及智能体任务执行能力等10余项核心指标上整体表现突出。

其中,在AAII公布的主要智能体能力基准测试之一τ²-bench(Tau Square Bench)中,“Mi:um K”获得87%的成绩,进入Agentic AI模型第一梯队。

τ²-bench主要用于评估AI在真实工作环境中与人协同、调用多种工具并完成任务闭环的能力。KT表示,“Mi:um K”在该项测试中的成绩处于领先水平,与Google最新模型Gemini 3处于相近水平。

除τ²-bench外,“Mi:um K”在衡量专业知识和高难度推理能力的MMLU Pro、GPQA、HLE等基准测试中也保持了较为均衡的表现。KT称,该模型在韩语理解相关指标上达到韩国最高水平。

KT相关人士表示,这一成绩是在40B级参数规模下取得的,因此更具意义。

KT还强调,“Mi:um K”在减轻大规模GPU算力基础设施压力、提升运行效率的同时,也具备较强的指令遵循能力,并在对韩国特有语言环境和社会语境的理解方面展现出突出的韩国本地化能力。

据介绍,“Mi:um K”采用from scratch(从零开始)方式开发,从模型架构设计到训练数据构建均由KT自主完成,目标是打造更贴合韩国企业环境的本土化AI。

KT表示,该模型自研发初期起便面向B2B市场布局,未来计划向金融、公共、制造等行业提供可面向真实业务流程实现自动化、并具备自主判断与处理能力的定制化AI智能体,以助力企业客户推进AX转型。

KT技术创新部门负责人(副社长)Oh Seung-pil表示,此次进入AAII榜单,客观证明了KT自研AI技术已达到全球水准。公司未来将以Agentic AI为抓手,成为推动韩国企业业务创新和数字化转型的AI合作伙伴。

关键词

#KT #Mi:um K #AAII #Artificial Analysis Intelligence Index #τ²-bench #Agentic AI #MMLU Pro #GPQA #HLE #B2B
版权所有 © DigitalToday。未经授权禁止转载或传播。