웰세이드 카루소AI [사진: 웰세이드]
웰세이드 카루소AI [사진: 웰세이드]

[디지털투데이 AI리포터] AI 음성 솔루션 개발사 웰세이드(WellSaid)가 기업용 플랫폼의 차세대 버전을 공개했다.

20일(현지시간) 실리콘앵글에 따르면, 웰세이드의 AI 음성 모델인 카루소 AI(Caruso AI)의 이번 업데이트는 자연스러운 맞춤형 음성을 더욱 빠르고 직관적으로 제작할 수 있도록 설계되었다.

카루소 AI 모델은 전문 성우의 독점 라이선스 오디오를 학습해 인간과 유사한 음성을 합성하며, 억양, 음색, 발음 등 다양한 요소를 세밀하게 조정할 수 있다. 이번 업데이트에서는 단어 단위로 음높이, 속도, 볼륨을 조절하고, 한 스크립트 내 여러 목소리를 동시에 적용할 수 있는 기능이 추가됐다. 또한 즉시 미리 보기 기능과 클릭 수 감소로 제작 효율성이 크게 향상됐다.

고품질 오디오 제공을 위해 샘플링 주파수 96kHz를 표준으로 설정해 음성의 자연스러움과 억양, 강조를 정확하게 표현할 수 있다. 약어, 브랜드명, 외래어 등의 발음을 위해 음성 철자 설계와 스마트 추천 기능도 제공된다. 플랫폼은 의료, 법률, 항공, 산업 분야 등 9000여개의 전문 용어, 500여개 법률 용어를 포함한 수천개 단어를 지원하며, 모두 옥스퍼드 사전 기준을 기반으로 한다.

이번 업데이트에서는 36개의 신규 언어·방언 음성이 추가돼 아랍어, 터키어, 페르시아어 등 글로벌 현지화가 가능해졌다. 영어 음성 라이브러리에는 호주, 영국, 캐나다, 아일랜드, 미국 내 지역별 억양이 포함된다.

웰세이드는 향후 사용 현황 대시보드, 발음 및 성능 향상 도구 등 추가 기능을 선보일 계획이며, 기업들은 이를 활용해 24시간 고객 문의 응대, 일정 관리, 맞춤형 커뮤니케이션 등 다양한 업무를 자동화할 수 있을 것으로 기대된다.

저작권자 © 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지

관련기사