DeepSeek(资料图)。图片来源:Shutterstock

中国AI公司DeepSeek在维持免费开源模型和低价API策略的同时,仍在推进大规模融资。业界普遍认为,其背后的关键支撑在于算力利用效率和内存效率。

5月26日,据Gigazine报道,DeepSeek正就一笔约700亿元人民币的融资事宜展开谈判。

自2025年1月发布DeepSeek-R1以来,DeepSeek持续受到全球AI行业关注。该模型当时被认为具备接近OpenAI推理模型o1的表现。到今年5月推出DeepSeek-V4-Pro后,美国政府旗下人工智能标准化与创新中心(CAISI)将其评为具备GPT-5级性能,不过也有分析指出,其与美国最先进模型相比仍存在约8个月差距。

相比性能表现,市场更关注DeepSeek的定价策略。该公司已将早期限时推出的API七五折优惠基本转为常态化,使其价格明显低于同级别模型,这也被视为其重要竞争优势。虽然中国的阿里巴巴(Alibaba)和Z.ai也加入了先进模型免费开源的趋势,但市场普遍认为,这两家公司在代理系统建设等方面具备更清晰的变现路径。相比之下,DeepSeek在盈利模式尚未完全明朗的情况下,仍持续推进大额融资谈判,因此更受外界关注。

AI分析师“GDP”将原因归结为“压倒性的效率”。大语言模型通常会通过KV缓存保存并复用已完成的计算结果,而“GDP”认为,DeepSeek在这一结构上的设计显著压低了内存占用。以100万Token输入为例,GLM-5的内存占用为60GB,Qwen3-235B-A22B约为89GB,而DeepSeek-V4仅为5.48GB。

这不仅是技术参数上的差别,更会直接反映到成本端。报道指出,随着AI产业对高带宽内存需求快速上升,内存价格上涨已成为行业的重要负担。目前,AI芯片成本中约63%由内存构成,在部分场景下,内存带来的成本压力甚至高于GPU。在此背景下,DeepSeek的高效架构被认为有助于显著压低模型运行成本,并为后续盈利能力提供基础。

在推理环节,DeepSeek的效率优势同样被反复提及。通过优化缓存利用结构,DeepSeek被认为能够在性能相对较低的AI芯片上进一步降低延迟。报道称,DeepSeek-V4-Pro运行所需算力仅为上一代模型的约1/3.7,DeepSeek-V4-Flash则仅需约1/9.8的算力即可完成处理。

这一策略也与中国AI产业当前面临的现实相吻合。受美国出口管制影响,中国企业获取NVIDIA最新高性能AI芯片仍受到限制。如果能够依靠较低规格芯片提供高性能AI服务,不仅有助于降低成本,也有助于提升供应链稳定性。

也有市场观点认为,DeepSeek这笔约700亿元融资未必只用于模型研发,更可能服务于长期战略布局。“GDP”预计,这笔资金有可能进一步投向中国内存和AI芯片企业,以构建“成本效率型AI生态”。换言之,DeepSeek或希望先通过免费开源模型和低价API抢占市场份额,再借助高效模型设计和本土硬件供应链建设,逐步实现真正的盈利。

业界认为,若这一路径最终落地,中国AI企业有望从单纯的价格竞争中走出,成长为全球AI产业中的新替代方案。

关键词

#DeepSeek #低价API #免费开源模型 #融资 #KV缓存 #内存效率 #推理成本 #AI芯片 #供应链稳定性
版权所有 © DigitalToday。未经授权禁止转载或传播。