据《华尔街日报》当地时间24日报道,中国AI开发公司DeepSeek已发布新一代AI模型V4系列的多个预览版本。
DeepSeek随后通过官方微信公众号公布了新模型上线消息。
在产品能力方面,DeepSeek表示,V4-Pro相较上一代在Agent式编程方面有明显提升。从使用体验来看,该公司称其表现已超过Anthropic的Claude Sonnet 4.5;在输出质量上,接近Claude Opus 4.6的非推理模式,但仍低于Opus 4.6的推理模式。
报道称,在中国本土AI厂商密集推进模型更新之际,DeepSeek此前曾多次推迟关键模型升级,因此此次V4发布被视为其多次延期后的重要更新。近期,Moonshot AI、MiniMax、Alibaba、ByteDance等公司均在加快产品迭代。
兼容华为Ascend也是V4此次发布的一大看点。DeepSeek表示,V4核心的效率优化已在NVIDIA GPU和华为Ascend NPU平台完成验证。华为方面则表示,Ascend全系产品将完整支持DeepSeek V4系列。
技术层面,V4采用了DeepSeek去年公布的Sparse Attention(稀疏注意力)技术。该技术无需一次处理全部内容,而是优先关注相关度更高的信息,从而支持更长文本的处理。
价格也是此次更新的重点之一。DeepSeek披露,V4-Pro输出价格为每百万Token 3.48美元,明显低于Claude Opus 4.6的25美元。与此同时,DeepSeek还推出了更便宜、速度更快的V4-Flash。该模型在简单任务上的表现可与V4-Pro相当,但在高难度任务上仍逊于V4-Pro。