AI音频技术初创公司ElevenLabs当地时间6日表示,已为全球音频平台SpoonLabs提供AI语音技术,将音频小说的制作周期从数月压缩至数小时。
SpoonLabs正从以音频直播为主的业务,向叙事类音频内容拓展,并重塑相关制作流程。此前,平台主要依靠配音演员录制内容,单集作品的制作周期长达4至7个月。
在引入ElevenLabs前,SpoonLabs测试了多款海内外TTS方案,并尽可能还原实际制作场景进行评估。其重点考察模型在标点驱动下的语调变化,以及基于上下文的情绪表达能力。最终,ElevenLabs在对比测试中获得最高评价。SpoonLabs还看重的是,ElevenLabs可在同一平台内提供语音克隆、背景音乐生成和音效生成等音频制作所需功能。
引入相关技术后,SpoonLabs于今年1月在韩国、日本和中国台湾同步上线音频小说服务PodNovel,分别推出韩国30种、日本26种、中国台湾19种内容。SpoonLabs计划自本月起在各市场每周新增不少于3种内容,并在短期内将整体内容规模扩充至100种以上。
SpoonLabs旗下PodNovel内容团队负责人Kim Hyun表示,ElevenLabs的技术“能够理解语境和情绪,表现接近真人演绎”。他称,基于AI的制作方式大幅提升了内容生产速度和扩展能力,也推动了制作方式本身的转变。
ElevenLabs Korea负责人Hong Sangwon表示,与SpoonLabs的合作显著改变了音频内容的生产方式。未来,公司将与更多媒体企业展开合作,推动形成新的内容制作标准。
记者信息