据The Information当地时间4月3日报道,中国AI初创公司DeepSeek预计将在未来数周发布新一代模型V4,并计划采用Huawei设计的最新芯片运行,引发市场关注。
报道指出,这被视为中国近年来推动半导体自主化进程中的又一进展。
为迎接V4发布,阿里巴巴、ByteDance、Tencent等中国大型科技公司正大举采购Huawei即将推出的相关芯片。The Information援引5名了解采购情况的消息人士称,整体采购规模或达数十万颗。
报道称,上述企业希望依托自身云服务提供DeepSeek V4,并将其整合进各类AI应用。受相关需求推动,预计将于4月启动量产的Huawei新款芯片Ascend 950PR,近几周价格已上涨约20%。
报道还称,DeepSeek工程团队长期以来一直基于NVIDIA的软硬件体系开发和运行模型。通常情况下,将使用NVIDIA硬件训练的模型迁移至其他厂商芯片,需要重写相关代码,并通过测试验证输出结果是否仍然可靠。
由于迁移难度较高,The Information援引两名消息人士称,过去几个月,DeepSeek一直与Huawei及另一家中国芯片设计公司Cambricon Technologies直接合作,推进相关适配工作。
报道提到,DeepSeek原计划于2月推出V4,但对Huawei芯片的适配拖慢了整体进度,导致发布时间推迟。
此外,DeepSeek还在开发两款V4变体,分别针对不同能力方向进行优化。消息人士称,这两款模型也将运行在中国芯片之上。
记者信息