[디지털투데이 홍하나 기자] 국내 인공지능(AI) 스피커 시장이 기술 고도화에 나서고 있다. 음성명령 시 대답하는 목소리를 유명인의 것으로 대체하는 기술을 개발, 이를 적용하고 있다. 이로써 각 연령대, 성별 등 소비자 타겟팅을 공략할 수 있을 뿐만 아니라 더 나아가 글로벌 진출에도 도움이 될 것으로 전망된다.   

4일 관련 업계에 따르면, 카카오와 KT는 자사의 AI 스피커에 특정 인물 목소리로 음성을 합성하는 ‘음성합성 기술’을 적용했다. 이로써 음성명령 시 유명인들의 목소리로 답변을 들을 수 있다.  

우선 카카오는 아이들을 타겟으로 삼았다. 현재 성우 목소리를 완전히 대체하는 수준은 아니며 특정한 상황, 특정 대화에 이를 적용했다.

왼쪽부터 KT AI 스피커 기가지니2, 카카오미니 (사진=각 사)
왼쪽부터 KT AI 스피커 기가지니2, 카카오미니 (사진=각 사)

이를 위해 카카오는 유명 유튜브 크리에이터와 카카오미니 음성제공 계약을 맺었다. 도티, 잠뜰, 헤이지니, 허팝 등 아이들에게 인기있는 크리에이터들의 목소리가 카카오미니에서 나오는 것. 

카카오미니 설정앱 헤이카카오에서 자녀 이름을 설정하면 스피커를 통해 크리에이터 목소리로 자녀 칭찬 기능, 아이 이름이 들어간 동화 재생 등의 서비스를 이용할 수 있다.  

예를 들어 “영희가 밥을 다 먹었대”라고 카카오미니에 말하면 허팝 목소리로 “진짜 영희가 밥을 다 먹었어? 와 대단하다”라고 대답해주는 방식이다. 이밖에 “영희가 손을 씻었어”, “영희가 치카치카를 안한대”, “도깨비 감투 들려줘”, “백설공주 동화 틀어줘”라고 음성명령할 수 있다. 

카카오의 음성합성 기술은 포털 다음의 뉴스 읽어주기 서비스에도 적용되어 있다. 여기에 적용된 음성합성기술은 텍스트를 분석, 음성으로 변환하는 기술이다. 

KT는 전연령대를 공략했다. 앞서 KT는 25일 자사의 AI 스피커 기가지니에 음성합성기술을 적용한 ‘박명수를 이겨라’ 퀴즈게임을 출시했다. 시사상식, 박명수 현실어록, 수도 맞추기 등 매일 5개의 문제를 푸는 게임이다. 

KT는 이 게임에 딥러닝 기반의 ‘개인화 음성 합성기술(P-TTS)'을 적용했다고 설명했다. 특히 이 기술은 며칠간 수집한 음성 데이터만으로 특정 인물의 목소리를 합성한다. 억양까지 학습해 사람처럼 말할 수 있다. 

아울러 KT도 카카오와 유사한 동화책 서비스와 유명 연예인 목소리 서비스를 준비 중이다. 

이처럼 두 기업이 AI 스피커의 음성합성 기술을 고도화하는데에는 AI 스피커의 대중화를 이끌어내기 위한 것으로 풀이된다. 현재까지 국내에서는 AI 스피커가 대중화되지 않은 만큼 유명인을 통한 특정 타겟팅을 펼치는 것으로 풀이된다. 

더불어 유명 연예인의 목소리를 AI 스피커에 심을 경우 해외진출까지 자연스럽게 이어질 수 있다. 다만 이 경우 타 언어지원 기술이 강화되어야 하기 때문에 다소 시간이 걸릴 것으로 전망된다. 

앞서 지난달 진행된 기자간담화에서 이필재 KT 부사장은 "국내 AI 스피커 시장은 경쟁사들도 지속적으로 들어오고 있고 최근에는 글로벌 플레이어까지 들어오겠다고 할 정도로 주류 시장으로 자리잡아가고 있다"면서 "KT는 글로벌 비즈니스화를 이루기 위해 최선을 다할 것"이라고 밝혔다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사