Google giới thiệu Gemini 3.5 Flash tại Google I/O 2026. Ảnh: Google

Google đã công bố chiến lược triển khai dòng mô hình AI Gemini 3.5 tại sự kiện I/O 2026, với Gemini 3.5 Flash được ra mắt trước và trở thành mô hình mặc định trên ứng dụng Gemini cũng như chế độ AI trong tìm kiếm. Trong khi đó, Gemini 3.5 Pro dự kiến xuất hiện vào tháng tới.

Theo Engadget và Business Insider, tại sự kiện thường niên Google I/O 2026 diễn ra ngày 19/5 (giờ địa phương) ở California, Mỹ, Google đã giới thiệu Gemini 3.5 Flash như phiên bản ưu tiên cho triển khai thực tế trên diện rộng.

Google cho biết Gemini 3.5 Flash được tối ưu để cân bằng giữa tốc độ, chi phí và hiệu năng. Hãng khẳng định mô hình này được xây dựng nhằm vượt Gemini 3.1 Pro trong các tác vụ AI agent thực tế và lập trình.

Theo Google, Flash là một dòng riêng, khác với Flash-Lite, đồng thời có lợi thế về tốc độ và chi phí so với dòng Gemini Pro hiện tại.

Với các tác vụ đòi hỏi khả năng suy luận sâu và xử lý ngữ cảnh dài, Gemini 3.5 Pro sẽ là phiên bản cao cấp hơn. Dù cho biết đã thu hẹp khoảng cách giữa Flash và Pro, Google vẫn chưa công bố chi tiết mẫu Pro tại sự kiện lần này.

Trên sân khấu I/O, CEO Google Sundar Pichai nói ông hiểu nhiều người muốn dùng thử trực tiếp bản Pro và đề nghị “hãy cho chúng tôi thêm thời gian đến tháng tới”. Ông không nêu lý do cụ thể cho việc lùi lịch ra mắt.

Theo các số liệu benchmark do Google công bố, Gemini 3.5 Flash đạt 76,2% trên Terminal-Bench 2.1, 83,6% trong bài kiểm tra sử dụng công cụ mở rộng MCP Atlas và 84,2% trên CharXiv Reasoning. Tính theo số token đầu ra mỗi giây, Google cho biết mô hình này nhanh gấp 4 lần so với các mô hình AI hàng đầu hiện nay.

Google cũng nhấn mạnh Gemini 3.5 Flash phù hợp với các tác vụ AI agent kéo dài. Mô hình có thể xử lý ổn định các quy trình nhiều bước và hỗ trợ công việc lập trình dưới giám sát. Theo hãng, một số đối tác, gồm ngân hàng và công ty fintech, đã sử dụng mô hình này để tự động hóa các quy trình kéo dài nhiều tuần.

Gemini 3.5 Flash hiện được cung cấp thông qua Google Antigravity, Gemini API trên Google AI Studio, Android Studio, nền tảng Gemini Enterprise Agent và Gemini Enterprise. Người dùng phổ thông cũng có thể truy cập mô hình này trên ứng dụng Gemini và chế độ AI trong tìm kiếm.

Tác nhân AI cá nhân Gemini Spark cũng hoạt động trên nền Gemini 3.5 Flash. Google cho biết đã bắt đầu triển khai cho nhóm thử nghiệm, hướng tới trải nghiệm AI agent có thể vận hành mà không cần người dùng liên tục mở laptop.

Về an toàn, Google cho biết đã tăng cường các biện pháp ứng phó với rủi ro an ninh mạng và các nguy cơ hóa học, sinh học, phóng xạ, hạt nhân (CBRN), đồng thời giảm khả năng tạo ra nội dung độc hại.

Hãng cũng cho biết đã hạn chế tình trạng mô hình từ chối trả lời không cần thiết đối với các truy vấn thông thường.

Động thái lần này cho thấy Google đang ưu tiên đưa Flash, dòng mô hình nhấn mạnh tốc độ và hiệu quả chi phí, vào môi trường sử dụng thực tế trước khi giới thiệu Gemini 3.5 Pro. Cùng lúc, hãng tiếp tục mở rộng hệ sinh thái Gemini bằng cách triển khai cùng một họ mô hình cho tìm kiếm, ứng dụng, công cụ dành cho nhà phát triển và nền tảng doanh nghiệp.

Điểm tiếp theo thị trường có thể theo dõi là chênh lệch hiệu năng giữa Gemini 3.5 Flash và Gemini 3.5 Pro khi phiên bản Pro ra mắt vào tháng tới. Nếu Flash giữ vai trò mặc định còn Pro tập trung vào suy luận phức tạp và xử lý ngữ cảnh dài, chiến lược AI của Google sẽ ngày càng rõ hơn theo hướng phân tách mô hình theo mục đích sử dụng.

Từ khóa

#Google #Gemini 3.5 #Gemini 3.5 Flash #Gemini 3.5 Pro #AI #Google I/O 2026
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.