DeepSeek标识。图片来源:Shutterstock

MIT《技术评论》当地时间21日报道称,中国AI企业正借助开源模型加快吸引开发者、扩展生态。与美国企业坚持以API为核心的闭源路线不同,中国厂商正推出可下载、可本地部署、支持二次开发的开源模型。

报道指出,这一趋势的转折点出现在2025年1月,当时DeepSeek发布了推理模型R1。据称,该模型以更低成本实现了接近美国顶尖模型的表现,不仅缩小了中美AI研究机构之间的差距,也提升了中国模型在开发者群体中的口碑。

此后,Z.ai、Moonshot、阿里巴巴旗下Qwen以及MiniMax等公司相继跟进,持续推出性能更强的新模型,与美国对手展开竞争。随着行业关注点从试点转向实际部署和系统集成,低成本、易定制的开源工具优势也进一步凸显。

数据也印证了这一变化。MIT与Hugging Face的研究人员表示,在截至2025年8月的一年中,全球AI模型下载量中,中国开源权重模型占比达到17.1%,略高于美国的15.86%,这是中国首次在这一指标上超过美国。Hugging Face上月还称,阿里巴巴模型及Qwen系列的用户衍生模型数量,已超过Google和Meta相关模型的总和。

不过,中国模型仍面临一定限制。报道提到,相关模型受中国内容审查体系影响,训练过程中被要求规避与政府政策相冲突的输出。今年2月,Anthropic还指出,部分中国研究机构曾通过“蒸馏”方式不当提取Claude的能力。所谓“蒸馏”,是指将一个模型的输出用于训练另一个模型的方法。

尽管西方市场存在反弹,“全球南方”对中国模型的采用正在增加。新加坡政府支持的项目AI Singapore在开发最新本土模型时,选择以阿里巴巴Qwen取代Meta Llama作为基础模型。马来西亚则于去年表示,将以DeepSeek为基础推动本国AI生态建设。内罗毕、圣保罗和旧金山的创业者,也在基于中国模型开发相关服务。

报道认为,美国企业出于回收高额训练成本,以及担忧模型被滥用等考虑,仍在维持闭源策略。相比之下,在美国出口管制限制先进芯片获取的背景下,中国企业正通过开放模型更快吸引外部反馈与贡献。开源模型也正推动AI产业走向一个比硅谷原先预期更为“多极化”的未来。

关键词

#DeepSeek #DeepSeek R1 #开源权重模型 #Hugging Face #MIT《技术评论》 #阿里巴巴 #Qwen #Z.ai #Moonshot #MiniMax
版权所有 © DigitalToday。未经授权禁止转载或传播。