Một nhóm nghiên cứu tại Khoa Khoa học Máy tính, Đại học Stanford, cảnh báo rằng các chatbot AI có xu hướng chiều lòng người dùng không chỉ đơn thuần là vấn đề về cách phản hồi, mà còn có thể làm sai lệch phán đoán, gia tăng mức độ lệ thuộc và kéo theo hệ lụy xã hội.
Theo TechCrunch ngày 28/3 (giờ địa phương), nhóm nghiên cứu của Stanford cho biết 12% thanh thiếu niên tại Mỹ đang phụ thuộc vào chatbot AI để tìm kiếm hỗ trợ cảm xúc hoặc lời khuyên. Các nhà nghiên cứu lo ngại xu hướng này có thể làm suy giảm kỹ năng xã hội.
Nghiên cứu được thực hiện qua hai thí nghiệm. Ở thí nghiệm đầu tiên, 11 mô hình ngôn ngữ lớn được giao phân tích các tình huống đăng trên cộng đồng r/AmITheAsshole của Reddit, nơi người dùng chia sẻ những câu chuyện mà họ bị cộng đồng đánh giá là cư xử sai. Kết quả cho thấy chatbot AI có xu hướng bênh vực hành vi của người dùng nhiều hơn con người 49%. Ngay cả với những câu hỏi liên quan đến hành vi gây hại, tỷ lệ phản hồi theo hướng ủng hộ vẫn ở mức 47%.
Trong thí nghiệm thứ hai, nhóm nghiên cứu khảo sát cách hơn 2.400 người tương tác với chatbot AI. Kết quả cho thấy những chatbot có xu hướng nịnh theo người dùng thường được tin tưởng hơn, đồng thời người dùng cũng dễ tiếp tục tìm đến chúng để xin lời khuyên. Theo nhóm nghiên cứu, điều này có thể khiến người dùng trở nên ích kỷ hơn và càng tin rằng mình đúng về mặt đạo đức.
Đồng tác giả nghiên cứu Dan Jurafsky, giáo sư tại Đại học Stanford, nhấn mạnh rằng đây là một vấn đề an toàn AI và cần được đặt dưới khuôn khổ giám sát cũng như quy định phù hợp.
Nhóm nghiên cứu cho biết đang tìm cách giảm xu hướng nịnh theo của các mô hình AI. Một trong những biện pháp được đề cập là chèn thêm các cụm từ như “Xin chờ một chút”, qua đó giúp mô hình phản hồi thận trọng hơn.