음성인식 비서 서비스가 가능한 스마트 스피커 제품들 /사진=voicebot.ai
음성인식 비서 서비스가 가능한 스마트 스피커 제품들 /사진=voicebot.ai

[디지털투데이 추현우 기자] 아마존, 애플, 구글, IBM, 마이크로소프트(MS) 등 주요 IT 기업이 제공하는 음성인식 비서 서비스의 음성 인식률이 인종별로 차이를 보인다는 연구 결과가 나와 논란이 일고 있다.

24일(현지시간) IT 전문 매체 엔가젯에 따르면, 미국 스탠퍼드 대학 연구팀이 아마존, 애플, 구글, IBM, MS가 제공하는 음성인식 서비스의 인식률을 조사한 결과, 백인 사용자보다 흑인 사용자의 음성 인식에 더 많은 오류가 발생한다는 사실을 발견했다.

5개 서비스의 단어 인식 오류율(Word Error Rate)은 백인의 경우 평균 19%인 반면, 흑인은 평균 35%에 달했다. 완전히 알아듣지 못한 인식 실패율은 백인은 2%에 불과했지만, 흑인은 20%까지 나왔다. 

각 서비스별 단어 인식 오류율(WEF) /사진=미국국립과학원회보(PNAS)
각 서비스별 단어 인식 오류율(WEF) /사진=미국국립과학원회보(PNAS)

 

이같은 결과는 데이터 편향(data bias) 때문으로 해석된다. 다양한 음성 데이터를 수집해 활용하지 않고 특정 인종의 음성 데이터가 더 많이 활용된 탓에 인공지능이 다른 인종의 음성 특성을 정확히 파악하지 못한 것이다.

연구를 진행한 스탠포드 대학 전산학과의 샤래드 고엘(Sharad Goel) 교수는 "새로운 기술에 대해 독립적인 감사가 필요하다는 사실을 연구 결과는 말해주고 있다"고 설명했다. 모든 것을 기업 스스로 규제할 수는 없다는 사실을 보여준 것이라는 평이다.

애플은 시리, 아마존은 알렉사, MS는 코타나, 구글은 어시스턴트라는 이름으로 음성인식 비서 서비스를 제공하고 있다.

스탠포드 대학의 연구 결과에 대해 애플과 MS, IBM은 언급하지 않았다. 아마존과 구글은 음성인식 비서 서비스를 지속해서 개선하고 있다고 답했다. 
 

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사