MIT《技术评论》当地时间21日报道称,中国AI企业正借助开源模型加快吸引开发者、扩展生态。与美国企业坚持以API为核心的闭源路线不同,中国厂商正推出可下载、可本地部署、支持二次开发的开源模型。
报道指出,这一趋势的转折点出现在2025年1月,当时DeepSeek发布了推理模型R1。据称,该模型以更低成本实现了接近美国顶尖模型的表现,不仅缩小了中美AI研究机构之间的差距,也提升了中国模型在开发者群体中的口碑。
此后,Z.ai、Moonshot、阿里巴巴旗下Qwen以及MiniMax等公司相继跟进,持续推出性能更强的新模型,与美国对手展开竞争。随着行业关注点从试点转向实际部署和系统集成,低成本、易定制的开源工具优势也进一步凸显。
数据也印证了这一变化。MIT与Hugging Face的研究人员表示,在截至2025年8月的一年中,全球AI模型下载量中,中国开源权重模型占比达到17.1%,略高于美国的15.86%,这是中国首次在这一指标上超过美国。Hugging Face上月还称,阿里巴巴模型及Qwen系列的用户衍生模型数量,已超过Google和Meta相关模型的总和。
不过,中国模型仍面临一定限制。报道提到,相关模型受中国内容审查体系影响,训练过程中被要求规避与政府政策相冲突的输出。今年2月,Anthropic还指出,部分中国研究机构曾通过“蒸馏”方式不当提取Claude的能力。所谓“蒸馏”,是指将一个模型的输出用于训练另一个模型的方法。
尽管西方市场存在反弹,“全球南方”对中国模型的采用正在增加。新加坡政府支持的项目AI Singapore在开发最新本土模型时,选择以阿里巴巴Qwen取代Meta Llama作为基础模型。马来西亚则于去年表示,将以DeepSeek为基础推动本国AI生态建设。内罗毕、圣保罗和旧金山的创业者,也在基于中国模型开发相关服务。
报道认为,美国企业出于回收高额训练成本,以及担忧模型被滥用等考虑,仍在维持闭源策略。相比之下,在美国出口管制限制先进芯片获取的背景下,中国企业正通过开放模型更快吸引外部反馈与贡献。开源模型也正推动AI产业走向一个比硅谷原先预期更为“多极化”的未来。