中国AI公司DeepSeek发布新一代AI模型V4系列。该系列以开源和低价为主要卖点,在保持接近前沿水平性能的同时,定价明显低于Opus 4.7和GPT-5.5。市场有观点认为,V4系列对行业带来的冲击,可能超过DeepSeek去年推出的推理模型R1。
具体来看,DeepSeek V4 Pro采用1.6万亿参数的混合专家(MoE)架构,激活参数为490亿,支持100万token上下文;V4 Flash总参数为2840亿,激活参数为130亿。两款模型均基于约33万亿token完成训练,并在MMLU Pro、GPQA Diamond、SWE-bench等基准测试中取得接近Opus 4.7和GPT-5.5的成绩。
围绕V4系列的竞争力,外界讨论焦点集中在“性价比”上。运营YouTube频道Forward Future的Matthew Berman近日在社交平台X(原Twitter)发文称,成本因素正促使美国企业转向DeepSeek。他表示,GPT-5.5和Opus 4.7的价格约为每100万输出token 30美元,而DeepSeek价格更低;同时,开源模式也意味着企业可以自行微调,并支持自托管部署。
Matthew Berman认为,多数企业场景并不需要最顶尖的AI能力,因此在“够用”的前提下,DeepSeek的吸引力反而更强。
不过,地缘政治风险仍被视为潜在隐忧。Matthew Berman指出,如果美国企业基于中国开源模型制定AI战略,一旦中国AI公司调整架构或中止访问,相关企业可能陷入被动。他还提到,如果中国模型像美国社交媒体平台一样成为全球讨论的重要基础,也可能引发“文化偏向被嵌入AI”的担忧。
对于美国政府对华AI出口管制的实际效果,市场看法并不一致。据DeepSeek论文披露,由于超节点扩容要到今年下半年才会完成,在此之前,V4 Pro的服务容量仍将受限。这也被一些观点视为,出口管制已在一定程度上产生效果。
不过,也有分析认为,相关限制可能反过来推动算法创新,促使团队以更低成本的GPU训练模型。
此前,Anthropic等美国AI模型开发商以及美国政府曾发出警告称,中国正在对美国AI模型进行大规模蒸馏。所谓蒸馏,是指将现有AI模型的输出结果作为训练数据,用于构建新模型。
对于蒸馏争议,Matthew Berman表示,有分析认为,DeepSeek使用美国AI模型输出进行训练的次数约为15万次,明显少于MoonshotAI的340万次和MiniMax的1300万次,因此仅靠蒸馏难以解释其达到当前性能水平。
他总结称,当前至少有两点值得关注:一是美国需要更积极推动开源模型开发,二是OpenAI与Anthropic也需要更快下调价格。从成本与性能的对比来看,DeepSeek目前对美国企业更具吸引力。