据The Information当地时间1月9日报道,援引两名知情人士消息称,中国AI初创公司DeepSeek正计划在未来数周内推出下一代主力AI模型V4。
报道指出,V4是DeepSeek于2024年12月发布的V3的后续模型,重点强化编程能力。知情人士称,根据内部基准测试结果,V4在编程测试中的表现已超过Anthropic Claude、OpenAI GPT系列等部分主流模型。
消息称,DeepSeek原计划在2月中旬前后发布V4,但具体上线时间仍可能调整。
在产品节奏上,DeepSeek于2024年12月推出V3,随后又在2025年1月发布开源推理模型R1,主打复杂问题推理。报道认为,V3帮助DeepSeek在全球AI社区打开知名度,而R1则在硅谷和华尔街引发震动,甚至带动了所谓“DeepSeek现象”。此后,DeepSeek还基于R1和V3在中国推出了聊天机器人。
报道还提到,DeepSeek在去年12月发布了V3.2模型。该模型在部分基准测试中的表现超过OpenAI GPT-5和Google Gemini 3.0 Pro。
从定位来看,V4并非V3的小幅迭代,而是DeepSeek面向下一阶段竞争推出的新一代主力模型。其与OpenAI、Google、Anthropic等全球头部厂商模型之间的竞争态势,受到市场关注。
据The Information披露,V4在处理超长代码提示方面取得了明显进展,这可能使其在复杂软件项目开发场景中更具优势。与此同时,V4据称在训练流程各阶段识别数据模式的能力也有所提升,并尽量避免由此带来的性能衰减。