[사진: 셔터스톡]
[사진: 셔터스톡]

[디지털투데이 AI리포터] 덴마크의 저작권 침해 방지 단체인 권리 연합(Rights Alliance)이 최근 디아이(The Eye)에 북스3(Books3) 데이터셋을 삭제해 달라고 요청했다.

21일 온라인 매체 기가진에 따르면 북스3은 더파일(The Pile)이라는 오픈 소스 AI 학습 데이터셋의 일부로 약 19만6640권의 방대한 책 데이터를 포함하고 있다. 메타의 대규모 언어 모델을 학습시키는 데 사용되기도 했다. 

디아이는 모든 데이터셋이 디지털 밀레니엄 저작권법을 준수한다고 주장하고 있지만 지적 재산권과 저작권 침해에 대한 우려가 제기됐다. AI 관련 저작권 침해 우려가 커짐에 따라 권리연합은 북스3을 삭제해 달라고 요청한 것.

마리아 프레덴슬룬드 권리 연합의 이사는 "불법으로 얻은 저작권 보호 콘텐츠를 사용하여 AI를 학습시키는 것을 막는 것이 중요하다"고 밝혔다. 

현재 디아이는 해당 데이터셋을 삭제했다. 
그러나 해당 데이터셋이 인터넷에서는 완전히 삭제되지 않은 것으로 보인다. 해당 파일이 인터넷 아카이브의 웨이백 머신(Wayback Machine)에 백업돼 있으며 다운로드 링크도 온라인에서 볼 수 있다는 설명이다. 

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지