[디지털투데이 홍하나 기자] 카카오의 인공지능(AI) 스피커 카카오미니가 등록한 계정의 사용자 목소리를 식별하고 맞춤형 서비스를 제공할 전망이다. 이와함께 영어인식 기술, 유명인 및 연예인 목소리가 적용될 계획이다.

25일 김훈 카카오 AI 부문 음성처리파트장은 “카카오미니 화자 인식 도입을 비롯한 카카오미니 목소리 확장, 음성엔진 적용 언어 확장 등의 새로운 기능을 추가할 계획”이라고 밝혔다.

카카오는 카카오미니에 화자 인식기술을 도입, 올해 상반기 중 카카오미니에 보이스 프로필 업데이트한다. 보이스 프로필은 이용자가 카카오미니 설정 앱에서 간단한 과정으로 자신의 목소리를 등록해 만들 수 있다.

25일 김훈 카카오 AI 부문 음성처리파트장은 “카카오미니 화자 인식 도입을 비롯한 카카오미니 목소리 확장, 음성엔진 적용 언어 확장 등의 새로운 기능을 추가할 계획”이라고 밝혔다.

보이스 프로필을 등록한 이용자는 화자 인식 기반의 맞춤형 서비스를 이용할 수 있다. 카카오는 보이스 프로필 업데이트와 동시에 카카오톡 메시지를 읽어주는 기능을 업데이트한다. 보이스 프로필을 등록한 이용자가 카카오톡을 활성화하면 이용자 본인이 아닌 사람의 요청에는 카카오톡 메시지를 읽어주지 않는 방식이다.

화자인식은 등록된 화자(말하는 사람)의 목소리를 인식해 화자를 구별하는 기술이다. 발화 시 음성 신호에서 특징을 추출, 등록된 화자 정보와 비교해 누가 누군지를 구별하고 동일 인물인지를 인식한다. 화자 인식은 화자를 구별해 개인화된 서비스를 제공할 수 있는 기반 기술이다. 음악/뉴스/상품 추천과 결제, 보안 및 인식률 향상(화자 이외 주변 잡음 제거) 등에 사용될 수 있다. 카카오는 상반기 내 화자 인식 기술을 카카오미니에 도입한다.

김훈 카카오 AI 부문 음성처리파트장은 "화자 인식 기술은 앞으로 이용자 맞춤형 대화 및 음성 인식률 향상(이용자 목소리 이외 주변 잡음을 제거) 등에 다양하게 활용될 계획"이라고 밝혔다.

음성 엔진 적용 언어도 확장한다. 음성 인식이 가능한 언어를 한국어에서 영어, 일어, 중국어 등으로 확장한다. 영어 인식은 개발이 완료된 상태로, 연내 번역 엔진과 결합해 카카오미니에 영어를 말하면 한국어로 번역해주는 개념의 음성 번역 기능을 업데이트할 예정이다. 카카오의 음성 엔진 영어인식 오류는 약 10% 정도다.

카카오미니 목소리도 더욱 다양해진다. 카카오는 올해 상반기부터 유명인/연예인 목소리를 카카오미니에 적용한다. 현재 성우 목소리를 완전히 대체하는 수준은 아니며 특정한 상황이나 특정 대화에서 유명인/연예인 목소리를 들을 수 있다.

여기에 적용된 음성합성기술은 텍스트를 분석해 음성으로 변환하는 기술이다. 음성 합성은 카카오미니와 포털 다음의 뉴스 읽어주기 서비스에 적용되어 있다.

카카오는 카카오미니, 다음, 카카오내비, 카카오맵, 멜론, 브런치, 카카오톡치즈 등에 음성엔진을 적용했다. 이외에도 2014년부터 음성 인식과 음성 합성 기술을 오픈 API로 공개해 수백 곳의 기업과 개인이 카카오의 음성 기술을 활용하고 있다. 작년에는 현대자동차와 제휴해 제네시스G70, 산타페, 그랜저 등 많은 차량에 카카오의 음성 엔진이 사용되고 있다.

카카오는 "앞으로도 음성 엔진은 다양한 파트너의 다양한 서비스와 제품에 제공되어 이용자들이 생활 속에서 카카오의 음성 기술을 만날 수 있도록 확장할 계획"이라고 밝혔다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지