DeepSeek:图片来源 Shutterstock

据The Information当地时间1月9日报道,援引两名知情人士消息称,中国AI初创公司DeepSeek正计划在未来数周内推出下一代主力AI模型V4。

报道指出,V4是DeepSeek于2024年12月发布的V3的后续模型,重点强化编程能力。知情人士称,根据内部基准测试结果,V4在编程测试中的表现已超过Anthropic Claude、OpenAI GPT系列等部分主流模型。

消息称,DeepSeek原计划在2月中旬前后发布V4,但具体上线时间仍可能调整。

在产品节奏上,DeepSeek于2024年12月推出V3,随后又在2025年1月发布开源推理模型R1,主打复杂问题推理。报道认为,V3帮助DeepSeek在全球AI社区打开知名度,而R1则在硅谷和华尔街引发震动,甚至带动了所谓“DeepSeek现象”。此后,DeepSeek还基于R1和V3在中国推出了聊天机器人。

报道还提到,DeepSeek在去年12月发布了V3.2模型。该模型在部分基准测试中的表现超过OpenAI GPT-5和Google Gemini 3.0 Pro。

从定位来看,V4并非V3的小幅迭代,而是DeepSeek面向下一阶段竞争推出的新一代主力模型。其与OpenAI、Google、Anthropic等全球头部厂商模型之间的竞争态势,受到市场关注。

据The Information披露,V4在处理超长代码提示方面取得了明显进展,这可能使其在复杂软件项目开发场景中更具优势。与此同时,V4据称在训练流程各阶段识别数据模式的能力也有所提升,并尽量避免由此带来的性能衰减。

关键词

#DeepSeek #V4 #V3 #R1 #编程大模型 #AI大模型 #The Information #OpenAI #Google #Anthropic #GPT系列
版权所有 © DigitalToday。未经授权禁止转载或传播。