73,2% người dùng vẫn tin câu trả lời sai của AI vì phản hồi quá trôi chảy

Hiện tượng “đầu hàng nhận thức” khi sử dụng chatbot LLM đã được ghi nhận trong một nghiên cứu mới. Ảnh: Shutterstock

Nghiên cứu mới của Đại học Pennsylvania cho thấy 73,2% người dùng vẫn chấp nhận câu trả lời sai từ chatbot mô hình ngôn ngữ lớn (LLM) khi phản hồi được diễn đạt quá trôi chảy. Xu hướng này mạnh hơn khi người dùng chịu áp lực thời gian, nhưng có thể giảm nếu được khuyến khích bằng phần thưởng nhỏ và nhận phản hồi ngay về đáp án đúng.

Theo Ars Technica ngày 3/4 (giờ địa phương), nhóm nghiên cứu tại Đại học Pennsylvania gọi hiện tượng này là “cognitive surrender” – tạm dịch là “đầu hàng nhận thức”. Khái niệm này không chỉ dừng ở việc giao một phần nhiệm vụ cho công cụ như máy tính hay GPS, mà là chấp nhận luôn lập luận của AI mà không kiểm chứng.

Nhóm nghiên cứu cũng đề xuất một dạng ra quyết định thứ ba, bên cạnh phán đoán trực giác và phán đoán phân tích của con người. Ở dạng này, thuật toán đóng vai trò dẫn dắt kết luận và lựa chọn của người dùng.

Để kiểm chứng giả thuyết, nhóm đã sử dụng bài kiểm tra phản tư nhận thức (CRT) với 1.372 người tham gia và thực hiện hơn 9.500 lượt thử nghiệm. Trong quá trình làm bài, người tham gia có thể chọn dùng chatbot LLM đã được điều chỉnh để khoảng một nửa câu trả lời là sai.

Kết quả cho thấy nhóm sử dụng AI đã tham khảo chatbot ở khoảng một nửa số câu hỏi. Khi chatbot đưa ra đáp án đúng, 93% người tham gia chấp nhận câu trả lời đó. Ngay cả khi AI trả lời sai, tỷ lệ chấp nhận vẫn lên tới 80%.

So với nhóm đối chứng, nhóm dùng AI đạt kết quả tốt hơn khi chatbot trả lời chính xác, nhưng lại làm bài kém hơn khi chatbot đưa ra đáp án sai. Dù vậy, độ tự tin vào câu trả lời của họ vẫn cao hơn 11,7%.

Nghiên cứu cũng chỉ ra rằng các biện pháp can thiệp đơn giản có thể làm giảm mức độ phụ thuộc vào AI. Khi người tham gia nhận được phần thưởng nhỏ và phản hồi ngay về đáp án đúng, tỷ lệ sửa lại đáp án sai do AI gợi ý tăng thêm 19 điểm phần trăm so với mức cơ sở. Ngược lại, khi bị giới hạn trong 30 giây, tỷ lệ này giảm 12 điểm phần trăm.

Khác biệt cá nhân cũng ảnh hưởng rõ đến mức độ lệ thuộc vào AI. Những người có điểm trí thông minh linh hoạt cao ít phụ thuộc vào chatbot hơn và thường sửa được câu trả lời sai. Trong khi đó, những người có xu hướng xem AI như một dạng “thẩm quyền” lại dễ làm theo các đáp án sai hơn.

Nhóm nghiên cứu không cho rằng việc dựa vào AI là hành vi phi lý. Tuy nhiên, họ nhấn mạnh hiệu quả cuối cùng phụ thuộc trực tiếp vào chất lượng của AI: khi AI chính xác, kết quả được cải thiện; nhưng nếu AI sai, thành tích cũng giảm theo.

Hyunwoo Choo cookinpapa@d-today.co.kr

Từ khóa