Theo SiliconAngle, Moonshot AI - startup AI của Trung Quốc - vào ngày 21/4 đã công bố Kimi-K2.6, phiên bản mới nhất trong dòng mô hình ngôn ngữ lớn mã nguồn mở Kimi. Công ty cho biết mô hình này vượt GPT-5.4 và Claude Opus 4.6 trên nhiều bài đánh giá AI.
Kimi-K2.6 được xây dựng trên hàm kích hoạt SwiGLU (Swish Gated Linear Unit), nhằm tối ưu hiệu quả phần cứng và đơn giản hóa quá trình huấn luyện mô hình ngôn ngữ lớn. Đây cũng là kỹ thuật đã được sử dụng trong nhiều LLM mã nguồn mở khác, trong đó có dòng Meta Llama.
Về kiến trúc, Kimi-K2.6 gồm 384 expert, tức các mạng nơ-ron nhỏ được tối ưu cho từng nhiệm vụ cụ thể. Với mỗi prompt, mô hình chỉ kích hoạt 8 expert để tạo phản hồi, qua đó giảm nhu cầu tính toán. Bên cạnh đó, mô hình sử dụng công nghệ Multi-head Latent Attention (MLA) để xác định những phần quan trọng nhất trong prompt, với hiệu quả phần cứng được đánh giá cao hơn cơ chế attention truyền thống.
Moonshot AI cho biết Kimi-K2.6 còn tích hợp bộ mã hóa thị giác 400 triệu tham số, cho phép xử lý dữ liệu đầu vào đa phương thức ngoài văn bản. Nhờ đó, người dùng có thể tạo một website hoàn chỉnh chỉ từ câu lệnh và bản phác thảo giao diện.
Với các tác vụ phức tạp và tốn thời gian, Kimi-K2.6 có thể vận hành đồng thời tối đa 300 agent. Mô hình sẽ chia nhỏ công việc thành nhiều phần để các agent xử lý song song, từ đó rút ngắn thời gian hoàn thành so với cách xử lý tuần tự.
Kimi-K2.6 cũng hỗ trợ tính năng "claw groups" (claw groups), cho phép con người và agent phối hợp phân chia công việc. Theo Moonshot AI, khả năng lập trình ở tầng thấp, chẳng hạn với ngôn ngữ Rust, cũng đã được cải thiện so với phiên bản trước.