据TechCrunch当地时间26日报道,法国AI公司Mistral开源了文本转语音(TTS)模型Voxtral TTS。
该模型主要面向语音助手和客服等场景,将直接与ElevenLabs、Deepgram、OpenAI等厂商展开竞争。
Voxtral TTS支持英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语共9种语言。Mistral副总裁Pierre Stock表示,公司根据客户需求推出了这款小型语音模型,可运行于智能手表、智能手机、笔记本电脑等边缘设备,在控制成本的同时兼顾性能表现。
Voxtral TTS还可基于不足5秒的语音样本生成定制语音,并较好保留语调、重音和发音上的细微差别。该模型在跨语言切换时仍可保持音色一致性,可用于配音和实时翻译。Mistral表示,Voxtral TTS的目标是生成更接近真人发声的语音,而非机械化的“机器人音”。
记者信息