DeepSeek(图片来源:Shutterstock)

据《华尔街日报》当地时间24日报道,中国AI开发公司DeepSeek已发布新一代AI模型V4系列的多个预览版本。

DeepSeek随后通过官方微信公众号公布了新模型上线消息。

在产品能力方面,DeepSeek表示,V4-Pro相较上一代在Agent式编程方面有明显提升。从使用体验来看,该公司称其表现已超过Anthropic的Claude Sonnet 4.5;在输出质量上,接近Claude Opus 4.6的非推理模式,但仍低于Opus 4.6的推理模式。

报道称,在中国本土AI厂商密集推进模型更新之际,DeepSeek此前曾多次推迟关键模型升级,因此此次V4发布被视为其多次延期后的重要更新。近期,Moonshot AI、MiniMax、Alibaba、ByteDance等公司均在加快产品迭代。

兼容华为Ascend也是V4此次发布的一大看点。DeepSeek表示,V4核心的效率优化已在NVIDIA GPU和华为Ascend NPU平台完成验证。华为方面则表示,Ascend全系产品将完整支持DeepSeek V4系列。

技术层面,V4采用了DeepSeek去年公布的Sparse Attention(稀疏注意力)技术。该技术无需一次处理全部内容,而是优先关注相关度更高的信息,从而支持更长文本的处理。

价格也是此次更新的重点之一。DeepSeek披露,V4-Pro输出价格为每百万Token 3.48美元,明显低于Claude Opus 4.6的25美元。与此同时,DeepSeek还推出了更便宜、速度更快的V4-Flash。该模型在简单任务上的表现可与V4-Pro相当,但在高难度任务上仍逊于V4-Pro。

关键词

#DeepSeek #V4 #V4-Pro #V4-Flash #AI模型 #华为Ascend #NVIDIA GPU #Sparse Attention #Token价格 #Claude
版权所有 © DigitalToday。未经授权禁止转载或传播。