Gần một nửa người tham gia một thử nghiệm của Surfshark đã không thể phân biệt chính xác bình luận do bot AI tạo ra với nội dung của người thật trên mạng xã hội.
Theo TechRadar, ngày 25/5 (giờ địa phương), Surfshark phối hợp với các học viên cao học tại Đại học Malmo thực hiện bài kiểm tra trên 710 người tham gia. Kết quả cho thấy chỉ 53% vượt qua bài kiểm tra, trong khi 47% còn lại không nhận diện đúng.
Bài thử nghiệm mang tên “Bot or Not”, được thiết kế theo dạng mô phỏng có giới hạn thời gian. Người tham gia vào vai người kiểm duyệt nội dung, phải xác định 10 bình luận do bot tạo ra trong 4 chủ đề trong vòng 120 giây. Công cụ này do học viên cao học ngành thiết kế tương tác của Đại học Malmo phát triển cho triển lãm UNFOLD tại Milan Design Week.
Kết quả chênh lệch rõ rệt theo từng chủ đề. Với nội dung về trung tâm dữ liệu, vốn ít yếu tố cảm xúc, tỷ lệ phát hiện bot đạt 71%, còn độ chính xác lên tới 76% – mức cao nhất trong các chủ đề được thử nghiệm.
Ở cuộc tranh luận về “pizza dứa”, tỷ lệ phát hiện đạt 64% và độ chính xác là 69%. Trong khi đó, với chủ đề nhập cư - vốn nhạy cảm về cảm xúc và chính trị - tỷ lệ phát hiện giảm còn 54%, còn độ chính xác ở mức 63%. Chủ đề quyền phụ nữ ghi nhận kết quả thấp hơn nữa, với tỷ lệ phát hiện 49% và độ chính xác 61%. Số trường hợp nhầm người thật là bot cũng tăng lên ở các chủ đề này.
Khác biệt theo độ tuổi cũng được ghi nhận. Nhóm từ 20 tuổi trở xuống tìm ra khoảng 65% bot, với độ chính xác hơn 71%, cao nhất trong các nhóm tuổi. Kết quả tích cực này cũng xuất hiện ở nhóm 20-30 tuổi. Tuy nhiên, ở nhóm 41-50 tuổi, tỷ lệ phát hiện giảm còn 42% và độ chính xác còn 59%. Nhóm trên 50 tuổi nhỉnh hơn đôi chút.
Luis Costa, phụ trách nghiên cứu tại Surfshark, cho rằng kết quả này không thể lý giải đơn thuần bằng khả năng đọc hiểu hay kỹ năng sử dụng truyền thông. Theo ông, khi tranh luận bị đẩy lên cao trào, cảm xúc có thể làm suy giảm khả năng nhận diện nội dung đáng ngờ.
Ông cho biết để đối phó với các hoạt động thao túng tự động, điều quan trọng hơn việc soi xét từng câu chữ là giữ được sự bình tĩnh và hiểu rõ điểm yếu của chính mình khi tiếp nhận thông tin.
Tác động của bot cũng đang gia tăng. Theo ước tính trong ngành, vào các giai đoạn bầu cử, khoảng 23% thảo luận chính trị trên X được bot khuếch đại. Một khảo sát trước đó của Surfshark cũng cho thấy các nền tảng lớn mỗi năm xóa hơn 6,3 tỷ tài khoản giả.
Hiện “Bot or Not” đã được mở công khai trên trình duyệt web, cho phép người dùng tự làm bài kiểm tra và so sánh điểm số với 710 người tham gia trước đó.