TechCrunch 26日报道称,企业级AI公司Cohere发布了开源自动语音识别(ASR)模型Transcribe,进一步扩展其语音AI产品布局。
据介绍,Transcribe的参数规模为2亿,可在消费级GPU上运行,支持英语、法语、德语、意大利语等14种语言。
Cohere表示,Transcribe的整体表现优于Zoom Scribe v1、IBM Granite 4.0 1B、ElevenLabs Scribe v2和Qwen3-ASR-1.7B等语音模型。在Hugging Face开源ASR排行榜上,该模型的平均词错误率(WER)为5.42,领先多款同类产品。
不过,TechCrunch也指出,Transcribe在葡萄牙语、德语和西班牙语上的表现相对偏弱。
在处理效率方面,Cohere称,Transcribe可在1分钟内处理525分钟音频。公司计划未来将该模型整合进企业级AI平台North,并以免费API形式提供。
记者信息