DeepSeek发布V4系列模型：开源低价，对标Opus 4.7和GPT-5.5

中国AI公司DeepSeek发布新一代AI模型V4系列。该系列以开源和低价为主要卖点，在保持接近前沿水平性能的同时，定价明显低于Opus 4.7和GPT-5.5。市场有观点认为，V4系列对行业带来的冲击，可能超过DeepSeek去年推出的推理模型R1。

具体来看，DeepSeek V4 Pro采用1.6万亿参数的混合专家（MoE）架构，激活参数为490亿，支持100万token上下文；V4 Flash总参数为2840亿，激活参数为130亿。两款模型均基于约33万亿token完成训练，并在MMLU Pro、GPQA Diamond、SWE-bench等基准测试中取得接近Opus 4.7和GPT-5.5的成绩。

围绕V4系列的竞争力，外界讨论焦点集中在“性价比”上。运营YouTube频道Forward Future的Matthew Berman近日在社交平台X（原Twitter）发文称，成本因素正促使美国企业转向DeepSeek。他表示，GPT-5.5和Opus 4.7的价格约为每100万输出token 30美元，而DeepSeek价格更低；同时，开源模式也意味着企业可以自行微调，并支持自托管部署。

Matthew Berman认为，多数企业场景并不需要最顶尖的AI能力，因此在“够用”的前提下，DeepSeek的吸引力反而更强。

不过，地缘政治风险仍被视为潜在隐忧。Matthew Berman指出，如果美国企业基于中国开源模型制定AI战略，一旦中国AI公司调整架构或中止访问，相关企业可能陷入被动。他还提到，如果中国模型像美国社交媒体平台一样成为全球讨论的重要基础，也可能引发“文化偏向被嵌入AI”的担忧。

对于美国政府对华AI出口管制的实际效果，市场看法并不一致。据DeepSeek论文披露，由于超节点扩容要到今年下半年才会完成，在此之前，V4 Pro的服务容量仍将受限。这也被一些观点视为，出口管制已在一定程度上产生效果。

不过，也有分析认为，相关限制可能反过来推动算法创新，促使团队以更低成本的GPU训练模型。

此前，Anthropic等美国AI模型开发商以及美国政府曾发出警告称，中国正在对美国AI模型进行大规模蒸馏。所谓蒸馏，是指将现有AI模型的输出结果作为训练数据，用于构建新模型。

对于蒸馏争议，Matthew Berman表示，有分析认为，DeepSeek使用美国AI模型输出进行训练的次数约为15万次，明显少于MoonshotAI的340万次和MiniMax的1300万次，因此仅靠蒸馏难以解释其达到当前性能水平。

他总结称，当前至少有两点值得关注：一是美国需要更积极推动开源模型开发，二是OpenAI与Anthropic也需要更快下调价格。从成本与性能的对比来看，DeepSeek目前对美国企业更具吸引力。

Chi-gyu Hwang delight@d-today.co.kr

关键词