Mistral(图片来源:Shutterstock)

据TechCrunch当地时间26日报道,法国AI公司Mistral开源了文本转语音(TTS)模型Voxtral TTS。

该模型主要面向语音助手和客服等场景,将直接与ElevenLabs、Deepgram、OpenAI等厂商展开竞争。

Voxtral TTS支持英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语共9种语言。Mistral副总裁Pierre Stock表示,公司根据客户需求推出了这款小型语音模型,可运行于智能手表、智能手机、笔记本电脑等边缘设备,在控制成本的同时兼顾性能表现。

Voxtral TTS还可基于不足5秒的语音样本生成定制语音,并较好保留语调、重音和发音上的细微差别。该模型在跨语言切换时仍可保持音色一致性,可用于配音和实时翻译。Mistral表示,Voxtral TTS的目标是生成更接近真人发声的语音,而非机械化的“机器人音”。

关键词

#Mistral #Voxtral TTS #文本转语音 #开源模型 #语音合成 #边缘设备 #语音助手 #客服
版权所有 © DigitalToday。未经授权禁止转载或传播。