레딧, AI 기업 데이터 스크래핑 차단 조치

AI요약 ☞ 레딧은 AI 기업이 웨이백 머신을 통해 자사 데이터를 무단 수집하는 것을 방지하기 위해 웨이백 머신의 크롤링을 제한한다고 발표했다. 웨이백 머신은 레딧의 포스트, 댓글, 프로필을 저장할 수 없으며, 메인 페이지 아카이빙만 가능하다.

2025-08-12     AI리포터
레딧이 AI 기업의 데이터 스크래핑을 막았다. [사진: 셔터스톡]

[디지털투데이 AI리포터] 레딧이 인공지능(AI) 기업의 데이터 스크래핑을 차단했다.

11일(현지시간) IT매체 더버지에 따르면, 레딧은 AI 기업들이 미국 비영리 디지털 도서관 인터넷 아카이브의 웨이백 머신(Wayback Machine)을 통해 자사 데이터를 무단 수집한 사실을 확인하고 이를 차단하기로 결정했다.

앞으로 웨이백 머신은 레딧의 포스트·댓글·프로필을 크롤링할 수 없으며, 메인 페이지만 아카이빙 가능하다.

레딧은 과거에도 스크래핑 도구 접근을 차단한 바 있으며, AI 기업들에 데이터 제공 시 비용을 요구해 왔다. 이러한 방침의 일환으로 지난해 구글과 검색 및 AI 학습 데이터 제공 계약을 체결했고, 이후 주요 검색 엔진들이 비용을 지불하지 않으면 데이터를 크롤링하지 못하도록 차단했다.

한편, 인터넷 아카이브는 이번 조치에 대해 즉각적인 입장을 내놓지 않았다. 업계는 레딧이 AI 기업의 무단 데이터 활용을 막기 위해 강경 대응을 이어갈 것으로 보고 있다.