[디지털투데이 박근모 기자] 국내 연구진에 의해 한국어, 영어 뿐만 아니라 일본어, 중국어 등 9개 언어 음성인식기 개발에 성공했다. 말을 하게 되면 해당 언어로 바로 문자 변환도 가능하다. 

한국전자통신연구원(ETRI)는 사람의 음성을 실시간으로 문자로 변환 할 수 있는 기술개발에 성공했다고 18일 밝혔다. 이번에 공개된 기술은 사람들의 일상대화에서 언어별로 최대 95% 수준의 성능을 보여 상용화가 가능한 수준이다.

ETRI 연구진은 본 기술이 스마트폰을 비롯, 스마트 스피커, 스마트 홈 허브 기능을 가지는 셋톱박스, 냉장고, TV 등의 스마트 가전으로 음성인식 기술이 급격히 확산되고 있는 점을 고려할 때, 글로벌 시장 진출을 계획하는 국내 업체들에게 큰 도움이 될 것으로 기대했다.

특히 일상 대화체의 연속 발화가 가능해 향후 통역은 물론, 인공지능 비서, 방송의 자막화, 콜센터 서비스 등에 활용이 가능할 것으로 보고 있다.

ETRI 연구원들이 현장에서 즉석으로 다국어 음성인식기 성능 평가를 진행하고 있다.(사진=ETRI)

ETRI는 인공지능(AI) 기술의 한 분야인 딥러닝 기술을 바탕으로 대용량의 데이터를 이용해 기술이 개발됐다고 설명했다.

또한 빅데이터와 관련된 대용량 데이터 자동 정제기술, 다국어 발음 생성기술 등 다국어 음성언어처리 핵심기술도 확보해 추후 동남아, 힌디어 등 타 언어로 확대가 쉽다고 전했다.

ETRI는 향후 음성인식 기술을 필요로 하는 국내 이동통신업체를 비롯하여 주요 포털, 음성인식엔진 기술을 상용화하고 있는 기업체에 기술 이전할 예정이다. 

이번 기술은 미래창조과학부의 지원을 받은'언어장벽 없는 국가 구현을 위한 자동통번역 산업 경쟁력 강화 사업'을 통해 개발됐으며 본 성과와 관련 국내·외 특허 30여건이 출원됐다.

김상훈 ETRI 음성지능연구그룹 프로젝트 리더는"향후 본 기술의 고도화를 통해 기술 경쟁력을 높이는 동시에, 지원 언어를 확대해 국내 업체들의 글로벌 시장 진출에 있어 도움이 되겠다"고 말했다.

한편, ETRI는 현재 본 기술을 내년 평창 동계올림픽 자동 통·번역 서비스 부문 공식 후원사인 한글과컴퓨터와 함께 '지니톡' 자동통역 서비스에 적용해 시범서비스 중이다.

향후 2020년 동경올림픽 개최 시점까지는 대상 언어를 14개 언어로 확대하고, 추가적으로 20개 언어 이상으로 늘려 나갈 예정이다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지