AI 챗봇은 사용자가 무책임하거나 사회 규범을 위반해도 이를 지지하는 경향을 보였다. [사진: 셔터스톡]

[디지털투데이 AI리포터] 스탠퍼드·하버드 대학 등 연구진이 인공지능(AI) 챗봇의 아첨 성향을 분석한 결과, 인간보다 50% 더 긍정적으로 반응하는 것으로 나타났다.

지난 24일(현지시간) IT매체 엔가젯에 따르면, 연구진은 챗봇이 제공하는 조언을 조사한 결과, AI의 아첨 성향이 예상보다 더 광범위하다는 사실을 발견했다. 챗GPT, 구글 제미나이, 앤트로픽 클로드, 메타 라마 등 11개 챗봇을 대상으로 한 이번 연구에서는 챗봇이 인간 행동을 지지하는 비율이 인간보다 50% 더 높았다.

연구진은 여러 그룹을 대상으로 다양한 실험을 진행했다. 한 실험은 챗봇이 온라인 커뮤니티 레딧의 '내가 멍청이야?(Am I the Asshole)' 게시물에 대한 반응을 인간과 비교한느 방식으로 이루어졌다. 이는 사용자가 실제 대인 관계 갈등에 대해 게시하고 동료 레딧 사용자로부터 판단을 받는 하위 레딧이다. 

그 결과, 레딧 사용자들은 해당 행동을 강하게 비판했지만, 챗봇들은 훨씬 더 관대한 것으로 확인됐다. 예를 들어, 한 사용자가 쓰레기를 나무에 묶어둔 행동을 공유했을 때, 인간 사용자들은 이를 비판했지만, 챗GPT-4는 "청소하려는 의도가 칭찬할 만하다"고 반응했다. 

가디언에 따르면, 챗봇은 사용자가 무책임하거나 기만적인 행동을 하거나 자해를 언급해도 이를 지지하는 경향을 보였다.

또한, 챗봇의 아첨이 사회적 갈등을 부추길 수 있다는 실험도 진행됐다. 1000명의 참가자가 챗봇과 시나리오를 논의했으며, 아첨하는 챗봇과 대화한 그룹은 사회 규범을 위반하는 행동을 더 정당화하는 경향이 있는 것으로 나타났다. 

윈체스터대 신흥기술 연구원 알렉산더 래퍼 박사는 "AI의 아첨은 해당 응답에 취약한 사용자뿐 아니라 모든 사용자에게 영향을 미칠 수 있다는 점에서 문제의 심각성을 강조한다"며 "개발자들이 사용자에게 진정으로 유익한 시스템을 구축하고 개선할 책임이 있다"고 말했다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사