Ngày 24/6 (giờ địa phương), VentureBeat đưa tin nhóm nghiên cứu của Xiaomi đã công bố HarnessX, một nền tảng tự động tối ưu harness cho AI agent. Theo Xiaomi, cách tiếp cận này có thể cải thiện đáng kể hiệu năng tác vụ của AI mà không cần thay đổi chính mô hình.
Harness là bộ khung phần mềm kết nối mô hình ngôn ngữ lớn với môi trường bên ngoài, bao gồm prompt, công cụ, quản lý bộ nhớ và luồng thực thi. Với các AI agent doanh nghiệp phải xử lý những tác vụ phức tạp và kéo dài, vai trò của harness càng trở nên quan trọng. Tuy vậy, việc thiết kế và tối ưu thành phần này đến nay chủ yếu vẫn được thực hiện thủ công.
HarnessX được xây dựng theo kiến trúc mô-đun, cho phép thay thế và tiến hóa harness một cách độc lập với mô hình. Trọng tâm của hệ thống là AEGIS, động cơ tối ưu hóa tự động gồm quy trình 4 bước: Digester phân tích nhật ký thực thi của agent; Planner đề xuất hướng cải thiện; Evolver tạo ra các chỉnh sửa ở cấp độ mã nguồn; Critic·Gate kiểm soát các tác dụng phụ có thể phát sinh.
Trong thử nghiệm với 15 cặp mô hình và bộ benchmark, HarnessX cải thiện hiệu năng ở 14 cặp, với mức tăng trung bình 14,5%. Trong đó, mô hình mã nguồn mở Qwen3.5-9B ghi nhận mức tăng 44% trên benchmark về lập kế hoạch triển khai, trong khi benchmark kỹ thuật phần mềm tăng 18,2%.
HarnessX cũng hỗ trợ cơ chế đồng tiến hóa, tức đồng thời tối ưu harness và huấn luyện mô hình. Dữ liệu thực thi được tạo ra trong quá trình cải thiện harness sẽ được dùng cho học tăng cường của mô hình. Theo nhóm nghiên cứu, cơ chế này giúp hiệu năng tăng thêm trung bình 4,7%, nhưng hiện chỉ áp dụng được với các mô hình mã nguồn mở.
Nhóm nghiên cứu sử dụng Claude Opus 4.6 làm meta agent, trong khi các agent trực tiếp thực thi tác vụ là Claude Sonnet 4.6 và GPT-5.4. Xiaomi cũng thừa nhận hạn chế hiện tại là meta agent vẫn cần một mô hình AI hàng đầu đủ mạnh để vận hành. Nhóm cho biết sẽ công bố mã nguồn trong các bản cập nhật tiếp theo.