据SiliconANGLE 21日 报道,中国AI初创公司Moonshot AI发布了Kimi系列最新开源大模型Kimi-K2.6。
Moonshot AI表示,Kimi-K2.6在多项AI基准测试中的表现超过GPT-5.4和Claude Opus 4.6。
从技术架构来看,Kimi-K2.6基于SwiGLU(Swish Gated Linear Unit)激活函数,旨在提升硬件效率并简化大语言模型训练流程。报道称,这一算法目前也已被集成到Meta Llama等多款开源大模型中。
在模型设计上,Kimi-K2.6采用由384个专家组成的MoE架构。每个专家都是针对特定任务优化的小型神经网络。模型在接收输入后,单次仅激活8个专家参与生成,以减少计算资源消耗;同时借助多头潜在注意力(MLA)机制提取输入中的关键信息。Moonshot AI称,该机制在硬件效率方面优于传统注意力方案。
除文本能力外,Kimi-K2.6还集成了一个拥有4亿参数的视觉编码器,可处理多模态输入。Moonshot AI表示,借助这一能力,用户仅凭指令和界面草图即可生成完整网站。
面对耗时较长且较为复杂的任务,Kimi-K2.6最多支持300个代理并行运行。系统会将整体任务拆分为多个子任务,交由不同代理并行处理,从而比顺序执行更快完成任务。
此外,Kimi-K2.6还提供“claw groups”功能,支持人类与代理分工协作。该模型在Rust等底层编程相关能力上,也较上一版本有所提升。
记者信息