企业级AI公司Cohere。图片来源:Cohere

TechCrunch 26日报道称,企业级AI公司Cohere发布了开源自动语音识别(ASR)模型Transcribe,进一步扩展其语音AI产品布局。

据介绍,Transcribe的参数规模为2亿,可在消费级GPU上运行,支持英语、法语、德语、意大利语等14种语言。

Cohere表示,Transcribe的整体表现优于Zoom Scribe v1、IBM Granite 4.0 1B、ElevenLabs Scribe v2和Qwen3-ASR-1.7B等语音模型。在Hugging Face开源ASR排行榜上,该模型的平均词错误率(WER)为5.42,领先多款同类产品。

不过,TechCrunch也指出,Transcribe在葡萄牙语、德语和西班牙语上的表现相对偏弱。

在处理效率方面,Cohere称,Transcribe可在1分钟内处理525分钟音频。公司计划未来将该模型整合进企业级AI平台North,并以免费API形式提供。

关键词

#Cohere #Transcribe #ASR模型 #自动语音识别 #开源模型 #Hugging Face #词错误率(WER) #消费级GPU #North #API
版权所有 © DigitalToday。未经授权禁止转载或传播。