Startup AI của Thụy Điển Opper AI vừa giới thiệu AI Roundtable, nền tảng thử nghiệm cho phép đưa nhiều mô hình AI vào cùng một câu hỏi để so sánh phản hồi, bỏ phiếu hoặc tranh luận ngay trên một giao diện. Điểm đáng chú ý của công cụ này là không chỉ đo hiệu năng từng mô hình riêng lẻ, mà còn cho thấy cách các mô hình đi tới một kết luận chung.
Theo Gizmodo ngày 27/3 (giờ địa phương), AI Roundtable cho phép người dùng chọn tối đa 50 mô hình trong hơn 200 mô hình AI để trả lời cùng một câu hỏi và so sánh kết quả theo thời gian thực. Nền tảng không dừng ở việc hiển thị đáp án, mà còn tổng hợp quan điểm chung, nêu bật các lập luận đáng chú ý và cho biết lý do đằng sau lựa chọn của từng mô hình. Nhờ đó, người dùng có thể theo dõi cả kết quả cuối cùng lẫn quá trình suy luận.
Ý tưởng cốt lõi của sản phẩm bắt nguồn từ “bài kiểm tra rửa xe”. Với một câu hỏi đơn giản như “tiệm rửa xe cách 50m thì nên đi bộ hay lái xe”, một số mô hình AI từng đưa ra lựa chọn thiếu thực tế. Từ đó, Opper AI mở rộng hướng tiếp cận sang việc đối chiếu và kiểm chứng phản hồi giữa nhiều mô hình. Trong thử nghiệm thực tế, gần một nửa số mô hình chọn phương án “đi bộ”, cho thấy kết quả đôi khi có thể đi ngược trực giác.
Để xử lý hạn chế này, AI Roundtable cung cấp chế độ “tranh luận” (Debate). Ở chế độ này, tối đa 6 mô hình AI có thể phản biện hoặc điều chỉnh lập luận của nhau trong quá trình thảo luận. Ngay cả khi kết quả bỏ phiếu ban đầu bị chia rẽ, diễn biến tranh luận vẫn có thể khiến các mô hình nghiêng dần về phương án có lập luận chặt chẽ hơn. Theo đó, nền tảng cho thấy khả năng phán đoán tập thể của nhiều mô hình có thể tinh vi hơn phản hồi từ một AI đơn lẻ.
Cách sử dụng nền tảng được thiết kế theo hướng trực quan. Người dùng nhập câu hỏi và các phương án trả lời, sau đó chọn chế độ “bỏ phiếu” (Poll) hoặc “tranh luận” (Debate), rồi thêm các mô hình AI từ danh sách có sẵn. Với chế độ bỏ phiếu, hệ thống hiển thị phân bổ lựa chọn của tối đa 50 mô hình cùng phần tổng hợp kết quả. Trong khi đó, chế độ tranh luận tập trung vào tương tác giữa một nhóm nhỏ mô hình và quá trình hình thành quyết định. Kết quả được trình bày theo từng mục như lựa chọn của từng mô hình, lý do bỏ phiếu và kết luận tóm tắt.
Nền tảng cũng hỗ trợ lưu kết quả dưới dạng ảnh PNG để chia sẻ. Thông qua mục Past Roundtable, người dùng có thể xem lại nhiều tình huống trước đó, chẳng hạn nên đi hướng nào trong một hầm ngục có tầm nhìn hạn chế, hoặc có nên giữ cửa thang máy khi cửa sắp đóng hay không. Đây đều là những câu hỏi gần với tình huống đời sống và yếu tố đạo đức. Dù vậy, các phiên làm việc mặc định được đặt ở chế độ riêng tư và chỉ được công khai nếu người dùng chủ động chia sẻ.
AI Roundtable hiện được cung cấp miễn phí. Người dùng có thể đăng ký API key để thực hiện thêm nhiều thử nghiệm hoặc quản lý lịch sử câu hỏi. Trên màn hình, nền tảng cũng hiển thị mục theo dõi chi phí gọi mô hình AI; khi mở rộng sử dụng, dịch vụ sẽ vận hành theo cơ chế tín dụng.
Giới chuyên môn đánh giá AI Roundtable có thể trở thành một môi trường thử nghiệm hữu ích để phát hiện thiên lệch và lỗi trong mô hình AI, đồng thời tìm hướng cải thiện, thay vì chỉ đóng vai trò là công cụ so sánh đơn thuần.