DeepSeek凭借内存效率支撑低价策略据悉正洽谈约700亿元人民币融资

中国AI公司DeepSeek在维持免费开源模型和低价API策略的同时，仍在推进大规模融资。业界普遍认为，其背后的关键支撑在于算力利用效率和内存效率。

5月26日，据Gigazine报道，DeepSeek正就一笔约700亿元人民币的融资事宜展开谈判。

自2025年1月发布DeepSeek-R1以来，DeepSeek持续受到全球AI行业关注。该模型当时被认为具备接近OpenAI推理模型o1的表现。到今年5月推出DeepSeek-V4-Pro后，美国政府旗下人工智能标准化与创新中心（CAISI）将其评为具备GPT-5级性能，不过也有分析指出，其与美国最先进模型相比仍存在约8个月差距。

相比性能表现，市场更关注DeepSeek的定价策略。该公司已将早期限时推出的API七五折优惠基本转为常态化，使其价格明显低于同级别模型，这也被视为其重要竞争优势。虽然中国的阿里巴巴（Alibaba）和Z.ai也加入了先进模型免费开源的趋势，但市场普遍认为，这两家公司在代理系统建设等方面具备更清晰的变现路径。相比之下，DeepSeek在盈利模式尚未完全明朗的情况下，仍持续推进大额融资谈判，因此更受外界关注。

AI分析师“GDP”将原因归结为“压倒性的效率”。大语言模型通常会通过KV缓存保存并复用已完成的计算结果，而“GDP”认为，DeepSeek在这一结构上的设计显著压低了内存占用。以100万Token输入为例，GLM-5的内存占用为60GB，Qwen3-235B-A22B约为89GB，而DeepSeek-V4仅为5.48GB。

这不仅是技术参数上的差别，更会直接反映到成本端。报道指出，随着AI产业对高带宽内存需求快速上升，内存价格上涨已成为行业的重要负担。目前，AI芯片成本中约63%由内存构成，在部分场景下，内存带来的成本压力甚至高于GPU。在此背景下，DeepSeek的高效架构被认为有助于显著压低模型运行成本，并为后续盈利能力提供基础。

在推理环节，DeepSeek的效率优势同样被反复提及。通过优化缓存利用结构，DeepSeek被认为能够在性能相对较低的AI芯片上进一步降低延迟。报道称，DeepSeek-V4-Pro运行所需算力仅为上一代模型的约1/3.7，DeepSeek-V4-Flash则仅需约1/9.8的算力即可完成处理。

这一策略也与中国AI产业当前面临的现实相吻合。受美国出口管制影响，中国企业获取NVIDIA最新高性能AI芯片仍受到限制。如果能够依靠较低规格芯片提供高性能AI服务，不仅有助于降低成本，也有助于提升供应链稳定性。

也有市场观点认为，DeepSeek这笔约700亿元融资未必只用于模型研发，更可能服务于长期战略布局。“GDP”预计，这笔资金有可能进一步投向中国内存和AI芯片企业，以构建“成本效率型AI生态”。换言之，DeepSeek或希望先通过免费开源模型和低价API抢占市场份额，再借助高效模型设计和本土硬件供应链建设，逐步实现真正的盈利。

业界认为，若这一路径最终落地，中国AI企业有望从单纯的价格竞争中走出，成长为全球AI产业中的新替代方案。

Jinju Hong hongjj@d-today.co.kr

关键词