OpenAI ngày 11/4 công bố hai mô hình AI cỡ nhỏ mới là GPT-5.4 mini và GPT-5.4 nano, hướng đến các tác vụ chuyên biệt trong hệ thống AI agent. Theo công ty, hai mẫu này phù hợp với những công việc cần xử lý song song, phản hồi nhanh và tối ưu chi phí.
Các mô hình mới được thiết kế cho những tác vụ như tìm kiếm trong mã nguồn, rà soát tệp và trích xuất dữ liệu. Đây là các công việc phụ trợ nhưng cần tốc độ cao, đặc biệt trong môi trường nhiều agent cùng hoạt động.
Theo TheNewsStack, khoảng cách hiệu năng giữa GPT-5.4 mini và phiên bản GPT-5.4 đầy đủ ở một số hạng mục không lớn. OpenAI cho biết trong các bài benchmark về lập trình và khả năng thao tác trên máy tính, bản mini cho kết quả tương đương bản đầy đủ, trong khi tốc độ nhanh hơn hai lần.
Với GPT-5.4 nano, OpenAI định vị đây là phiên bản rút gọn dành cho khối lượng công việc lớn. Mẫu này phù hợp với các tác vụ phân loại, trích xuất dữ liệu, xếp hạng và hỗ trợ lập trình ở mức cơ bản.
GPT-5.4 mini được cung cấp trên API, Codex và ChatGPT. Mô hình có context window 400 nghìn token, hỗ trợ đầu vào văn bản và hình ảnh. Trong khi đó, GPT-5.4 nano hiện chỉ được cung cấp qua API.
Ở SWE-bench Pro, benchmark đánh giá công việc kỹ sư phần mềm trong thực tế, GPT-5.4 mini đạt 54,38%, thấp hơn 3 điểm phần trăm so với phiên bản GPT-5.4 đầy đủ. Trên OSWorld-Verified, benchmark đo khả năng thao tác trên máy tính, bản mini đạt 72,13%, gần với mức 75,03% của mẫu flagship.
GPT-5.4 nano có hiệu năng thấp hơn mini, nhưng theo OpenAI, ở các tác vụ lập trình và gọi công cụ, mẫu này vẫn vượt GPT-5 mini ra mắt trước đó.
OpenAI cũng nhấn mạnh kịch bản sử dụng trong Codex. Theo đó, GPT-5.4 đảm nhiệm vai trò lập kế hoạch, điều phối và rà soát cuối cùng, còn các sub-agent chạy song song trên bản mini sẽ xử lý những tác vụ chuyên biệt như tìm kiếm mã nguồn, rà soát tệp dung lượng lớn và xử lý tài liệu liên quan.
OpenAI cho biết trong môi trường như vậy, mô hình phù hợp nhất không nhất thiết là mô hình lớn nhất, mà là mô hình phản hồi nhanh, sử dụng công cụ ổn định và vẫn duy trì hiệu năng tốt ngay cả với các tác vụ chuyên môn phức tạp.