[디지털투데이 유다정 기자] 기사를 네이버로 보는 시대. 기사 유통에 있어 네이버의 영향력이 막대해지면서 '편집 조작 의혹'도 따라왔다. 네이버는 뉴스 편집은 알고리즘에 의해 자동화됐다고 항변했으며, 29일 외부 검토 위원회 또한 "외부 조작 가능성은 없다"고 밝혔다. 이제 남은 것은 '제대로 된 기사'를 선별할 기준에 대한 고민이다.

지난 5월 발족한 네이버 뉴스 알고리즘 검토 위원회는 29일 발표회를 갖고 지난 6개월여에 걸쳐 진행한 네이버 뉴스 알고리즘 검토 결과를 공개했다. 

위원회는 전산학적 관점에서만 보지 않고 뉴스 서비스의 생명주기 전체를 포괄적 시각으로 접근했다는 설명이다. 네이버가 ▲어떤 데이터를 가지고 ▲어떤 자질(피처)을 선정해 알고리즘을 만들고 ▲어떻게 서비스하는지, 전 과정에 걸친 절차를 모두 봤다는 것이다.  

알고리즘 (표=네이버 뉴스 알고리즘 검토 위원회)
알고리즘 (이미지=네이버 뉴스 알고리즘 검토 위원회)
왼쪽부터 뉴스 검색(랭킹 알고리즘) 서비스, AiRS 뉴스 추천(에어스, 개인 맞춤형 뉴스) 서비스, 연예 및 스포츠 뉴스 서비스(이미지=네이버 뉴스 알고리즘 검토 위원회)
왼쪽부터 뉴스 검색(랭킹 알고리즘) 서비스, AiRS 뉴스 추천(에어스, 개인 맞춤형 뉴스) 서비스, 연예 및 스포츠 뉴스 서비스(이미지=네이버 뉴스 알고리즘 검토 위원회)

검토위는 네이버 뉴스 서비스를 ▲뉴스 검색(랭킹 알고리즘) 서비스 ▲AiRS 뉴스 추천(에어스, 개인 맞춤형 뉴스) 서비스 ▲연예 및 스포츠 뉴스 서비스로 구분해 검토했다. 

뉴스 검색 결과, '인간의 개입' 원칙적으로 불가능

네이버는 검토위에 뉴스검색 품질평가 가이드라인, 가이드라인을 바탕으로 학습데이터를 구축하는 과정 전반, 구축된 학습데이터 전체를 공개했다. 

검토 결과 뉴스검색 품질평가 가이드라인 7단계에 걸친 과정으로 작성됐고 뉴스의 연관성, 시의성, 품질을 기반으로 하고 있었다. 검토위는 명확한 가이드라인을 기반으로 품질평가 방향이 정립돼 있으며, 앞으로도 계속 이러한 시스템을 정착시키는 것이 중요할 것이라고 평가했다.

뉴스검색 결과는 알고리즘(SVMRank)을 통해 자동으로 배치되기 때문에 관리자의 개입은 원칙적으로 불가능하다. 뉴스검색 개발-운영-개선에 대한 의사 결정 이력이 모두 기록되고 있다. 

특히 '어뷰징 점수'를 활용해 낚시성 기사를 제공하는 언론사의 기사 품질 점수를 낮춘다. 어뷰징 행위라고 판단하는 행동이 중지되면 점수가 정상화 되는 알고리즘으로, 어뷰징 자질을 언론사 및 기사 단위로 부과해 잠재적인 언론사 역차별을 방지한다.

검색결과의 다양성, 균형성, 방향성을 모두 반영해 구현하는 것이 기술적으로 매우 도전적으로, 지속적인 노력 필요하다는 총평이다. 

AiRS 뉴스 추천, '필터버블 효과' 없었다

AiRS 뉴스 추천 서비스 영역에서도 편집자의 개입 없이 자동적으로 뉴스 이용자들의 피드백 데이터를 수집해 학습 데이터를 확보하고 있는 것으로 나타났다.

기사의 누적 조회수 및 누적 체류시간에 가중치를 부과, 상위/하위 기사를 각각 긍정적/부정적 학습데이터로 사용한다.

협력필터 (Collaborative Filtering)와 품질모델(Quality Model)을 결합해 이용자의 기사 선호도와 기사 품질을 고려한 개인화된 추천 점수를 계산하는 알고리즘을 활용하고 있다. 이 과정에서 이용자의 기존 관심사와는 다른 분야의 기사도 함께 추천될 수 있도록 해 ‘필터버블(Filter Bubbles, 확증편향)’ 문제를 최소화했다.

필터버블이란 사용자가 보고싶어 하는 정보를 알고리즘이 선별해 제공함으로써 사용자의 관점에 동의하지 않는 정보로부터 분리시켜, 결국엔 자신만의 문화적, 이념적 거품에 가둬지는 것을 말한다.

아울러 이용자 피드백은 고객문의나 의견 접수의 형태로 반영되고 있고, 포커스 그룹 미팅을 통해 이용자 모니터링을 실시하는 등 서비스 개선 과정에 이용자의 참여가 실질적으로 고려되고 있다.

위원회는 외부 검토위원회의 독립성은 보장하되, 네이버의 내부 평가와 외부 검토위원회와의 업무상 연계성과 내실을 기하는 상호 네트워크 형성하는 방안 추진할 것을 권고했다.

​연예/스포츠 기사 추천은 비맞춤형...속보∙매체 전문성 중요

마지막으로 연예 및 스포츠 기사에서는 비 맞춤형 뉴스 추천 서비스를 제공하고 있다. 연예/스포츠 뉴스는 콘텐츠의 속성이 다르기 때문에 전문 매체 여부에 따른 가산점, 실시간 업데이트 등 특화된 자질을 사용하고 최신성을 강조한다. 앞선 두 서비스에 비해 데이터 기반의 기계 학습이 아닌 규칙 기반의 알고리즘을 바탕으로 서비스가 운영되고 있다는 설명이다.  

맹성현 네이버 뉴스 알고리즘 검토 위원회 위원장이 검토 결과를 발표하고 있다
맹성현 네이버 뉴스 알고리즘 검토 위원회 위원장이 검토 결과를 발표하고 있다
왼쪽부터 김용찬 네이버 알고리즘 검토 위원회 위원, 맹성현 위원장, 장윤금 위원
왼쪽부터 김용찬 네이버 알고리즘 검토 위원회 위원, 맹성현 위원장, 장윤금 위원

검토 결과를 발표한 맹성현 정보과학회 언어공학연구회 자문위원은 "네이버의 절차는 대부분 자동화돼 관리자의 개입이 원천 차단돼 있다"며 "관련된 댓글이나 어뷰징을 막기 위한 자질 개발 및 가중치 조정 등의 변화도 반영되고 있다. 변경된 내용도 내부적으로 공개돼 공정성을 저해할 문제는 발견되지 않았다"고 말했다.

맹성현 위원은 다만 "각 서비스 별로 시스템 개발-운영-평가 과정에서 변화되는 모든 것이 조금 더 체계적으로 기록, 관리되고 부서간 공유될 수 있도록 시스템을 구축하는 것이 필요하다"며 "최고 정보 책임자(CIO)를 임명하는 것도 한 방법"이라고 조언했다. 

그러나 이번에 검토한 것은 네이버가 기술적으로 옳은 방법을 사용하고 있는지에 불과했다. 혹시라도 있을 수 있는 공정성 침해가 알고리즘 상에 존재하는지만 본 것이다.

맹 위원은 "위원회의 목표는 건전한 포털 뉴스 서비스가 갖춰야 할 기본적인 요소들이 데이터, 알고리즘, 서비스 운영, 피드백 절차 내에 존재하는지 확인하는 것이었다"며 "포털 뉴스 서비스가 따라야 할 저널리즘적 가치 자체에 대한 총체적이고 일반적인 기준이 존재하지 않다"는 한계를 설명했다.

김용찬 위원(숙명여자대학교 문헌정보학과 교수)도 "매체마다 이해관계도 다르고, 평판이나 뉴스 생산 전력 등을 어느 정도로 고려할 것인가에 대해 논의를 했지만 위원들마다 의견이 조금씩 갈렸다"고 밝혔다. 김 위원은 "그 부분에 대해선 네이버가 계속적으로 시스템을 수정해야 할 문제"이며 "바뀐 체제에서 어떻게 변할지는 지켜봐야할 것"이라고 전했다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사