Gemini 3.5 Flash cho thấy thế mạnh trong viết mã và lập kế hoạch thực tế

Gemini 3.5 Flash, mô hình AI chủ lực mới được Google giới thiệu. Ảnh: Google Blog

Gemini 3.5 Flash, mô hình AI mới của Google, đang được định vị như một công cụ hướng tới ứng dụng thực tế, với các năng lực từ viết mã, suy luận dựa trên ngữ cảnh dài đến hiểu đa phương thức và xử lý nhiều tác vụ song song.

Theo TechRadar ngày 21/5 (giờ địa phương), tại Google I/O 2026, Google đã công bố hàng loạt tính năng liên quan đến Gemini. Trong số đó, Gemini 3.5 Flash được chọn làm mô hình chủ lực, với trọng tâm là khả năng áp dụng vào các tình huống sử dụng hằng ngày.

Bài đánh giá của TechRadar ưu tiên trải nghiệm thực tế hơn là các thông số kỹ thuật Google công bố. Mô hình được thử qua 5 kịch bản gồm tạo trình mô phỏng từ một báo cáo về rác vũ trụ, xây lịch trình du lịch, hướng dẫn làm đồ thủ công, lập kế hoạch dọn dẹp trong nhà và xử lý một tình huống hài hước đòi hỏi suy luận song song. Điểm chung của các bài thử là mô hình phải giải quyết nhiều yêu cầu cùng lúc, thay vì chỉ trả lời từng câu hỏi riêng lẻ.

Ở bài thử đầu tiên, Gemini 3.5 Flash được kiểm tra năng lực suy luận đa phương thức và sinh mã. Từ một báo cáo môi trường về rác vũ trụ, mô hình đã tạo mã cho một trình mô phỏng cho phép người dùng thay đổi điều kiện để quan sát kết quả. Không dừng ở việc trực quan hóa số liệu, mô hình còn xây dựng cách thể hiện giúp người dùng thấy được tác động dài hạn khi số lượng vệ tinh phóng lên tăng hoặc khi áp dụng các biện pháp giảm thiểu.

Với bài toán lập lịch trình du lịch, mô hình thể hiện rõ khả năng phối hợp lộ trình, thời gian và điểm đến. Trong hành trình 4 ngày qua Hudson Valley và khu vực miền núi, Gemini 3.5 Flash đề xuất lịch trình trọn gói, gồm đi bộ đường dài vào buổi sáng, trải nghiệm ẩm thực vào buổi trưa, các cung đường ưu tiên cảnh quan và phương án thay thế khi trời mưa. Mô hình cũng giữ đúng mục tiêu chính của chuyến đi, thay vì chèn thêm những hoạt động không liên quan làm đứt mạch kế hoạch. Theo bài đánh giá, đây là ví dụ cho thấy Gemini 3.5 Flash có thể đồng thời cân đối nhiều điều kiện để xây dựng một lịch trình hợp lý.

Trong các tác vụ cần hướng dẫn theo từng bước, mô hình cho thấy khả năng chia nhỏ công việc phức tạp thành quy trình dễ hiểu. Khi được yêu cầu hướng dẫn tự đóng gáy một cuốn sổ tại nhà, Gemini 3.5 Flash tách rõ các bước bắt buộc và những phần bổ sung tùy chọn. Mô hình cũng dự báo trước những lỗi có thể phát sinh, nhưng không đi quá sâu vào giải thích mang tính chuyên môn. Cách trình bày này cho thấy mục tiêu không phải là tạo ra một cuốn sổ đạt chuẩn bảo quản như trong bảo tàng, mà là giúp người dùng nắm nguyên lý cơ bản để hoàn thành một cuốn sổ chắc chắn. Việc đưa cả thời gian chờ khô vào quy trình cũng phản ánh khả năng xây dựng hướng dẫn tương đối đầy đủ.

Khả năng suy luận dựa trên hình ảnh cũng được thể hiện ở bài thử dọn dẹp nhà cửa. Khi được cung cấp ảnh một căn phòng bừa bộn và yêu cầu lập kế hoạch dọn dẹp trong 25 phút, Gemini 3.5 Flash không xử lý mọi việc theo cùng một mức ưu tiên, mà sắp xếp thứ tự công việc rõ ràng. Mô hình đề xuất dọn các món đồ dễ nhìn thấy trước, đồng thời khuyến nghị không nên bắt đầu sắp xếp ngăn kéo nếu quỹ thời gian quá ngắn. Theo TechRadar, đây là cách tiếp cận nhằm tối đa hóa hiệu quả trong thời gian giới hạn.

Bài thử cuối cùng tập trung vào suy luận song song. Dù được đặt trong một tình huống mang tính đùa vui, năng lực này vẫn bộc lộ khá rõ. Gemini 3.5 Flash xử lý yêu cầu “điều tra bí mật của người ở ghép tự nhận là bình thường nhưng thực ra giấu ba con chim cánh cụt trong áo khoác” bằng cách tách thành nhiều lớp phân tích, gồm hành vi, dấu hiệu từ môi trường xung quanh và mức độ nhất quán trong tương tác xã hội. Mô hình lần lượt rà soát các yếu tố như cách di chuyển, tần suất mua cá hay xu hướng né tránh thời tiết ấm, rồi tổng hợp các giả thuyết. Điểm đáng chú ý là mô hình không chỉ suy luận tuần tự theo từng bước, mà còn xử lý đồng thời nhiều khả năng khác nhau.

Xuyên suốt 5 bài thử, thế mạnh của Gemini 3.5 Flash không nằm đơn thuần ở tốc độ phản hồi, mà ở khả năng duy trì ngữ cảnh và chuyển đổi linh hoạt giữa các kiểu tác vụ. Theo bài đánh giá, mô hình vẫn giữ được mục tiêu ban đầu của yêu cầu khi di chuyển qua những công việc rất khác nhau như phân tích rác vũ trụ, thiết kế lịch trình, hướng dẫn thủ công hay lập chiến lược dọn dẹp. Kết quả này cũng cho thấy những năng lực mà Google nhấn mạnh, như viết mã, xử lý ngữ cảnh dài, hiểu hình ảnh và lập kế hoạch kiểu tác nhân, không tồn tại tách biệt mà được tích hợp trong cùng một mô hình.

Tuy nhiên, để mở rộng phạm vi ứng dụng trong thực tế, Gemini 3.5 Flash có thể sẽ cần quyền truy cập sâu hơn vào dữ liệu người dùng. Khi mô hình tham gia nhiều hơn vào các công việc thường ngày, lượng thông tin cá nhân và ngữ cảnh cần tiếp nhận cũng có thể tăng theo. Điều đó đồng nghĩa năng lực cạnh tranh của Gemini 3.5 Flash có thể không chỉ phụ thuộc vào hiệu năng, mà còn gắn với mức độ truy cập và khả năng kiểm soát dữ liệu trong môi trường dịch vụ thực tế.

Yoonseo Lee yslee@d-today.co.kr

Gemini 3.5 Flash cho thấy thế mạnh trong viết mã và lập kế hoạch thực tế

Mô hình mới của Google được thử qua 5 kịch bản, từ lập trình đến dọn dẹp, với điểm nhấn là giữ ngữ cảnh và xử lý đa nhiệm

Đang tạo...

Tóm tắt AI

Qua 5 bài thử từ viết mã, lên lịch trình du lịch đến sắp xếp nhà cửa, Gemini 3.5 Flash cho thấy khả năng duy trì ngữ cảnh dài, hiểu đa phương thức và xử lý nhiều yêu cầu cùng lúc.

Từ khóa