GLM-5.2的看点不仅在于性能表现,也包括训练基础设施和部署方式。图片来源:Shutterstock

中国人工智能公司Z.ai(原Zhipu AI)发布新一代开源大语言模型GLM-5.2。该公司称,这款模型在性能上已接近Anthropic旗舰产品,并在成本和开放性方面打出差异化优势,引发业界关注。

据加密货币媒体Decrypt 6月18日(当地时间)报道,Z.ai表示,GLM-5.2在多项编程和Agent基准测试中跻身全球第一梯队。

其中,在评估长周期自主软件开发能力的FrontierSWE基准测试中,GLM-5.2得分为74.4,接近Claude Opus 4.8的75.1,高于GPT-5.5的72.6。

在衡量GitHub Issue解决能力的SWE-bench Pro测试中,GLM-5.2得分62.1,也高于GPT-5.5的58.6和上一代GLM-5.1的58.4。

除性能表现外,市场更关注其训练基础设施。Z.ai称,GLM-5.2训练全程基于Huawei Ascend AI加速器,未使用Nvidia硬件。

在美国持续收紧对华先进半导体出口管制的背景下,这一表述被外界视为,中国企业依托本土AI基础设施,仍有能力开发接近全球顶尖水平的模型。

在发布和分发策略上,GLM-5.2采用MIT许可证开源,未设置国家或地区使用限制。开发者可通过Hugging Face直接下载模型权重,官方同时提供量化版本。

Z.ai还表示,其编程服务用户无需排队,即可直接选择“GLM-5.2”模型使用,平台并提供带有限制的免费体验。

长上下文能力也是开发者关注的重点。GLM-5.2支持最高100万Token上下文窗口,较GLM-5.1的20万Token提升至5倍,可用于一次性分析大型代码仓库、跨文件重构以及复杂AI Agent工作流等场景。该模型采用混合专家架构(MoE,Mixture of Experts),参数规模达到7440亿。

价格方面,GLM-5.2的API定价为输入每100万Token 1.40美元、输出每100万Token 4.40美元,明显低于Claude Opus 4.8输入每100万Token 5美元、输出每100万Token 25美元的水平。其编程服务套餐月费约18美元起,并可适配Claude Code、Cline、Kilo Code等主流开发工具。

本地部署也是其卖点之一。AI优化公司Unsloth AI已将GLM-5.2量化为2-bit GGUF格式,将原始1.51TB的体积压缩至约238GB。不过,若要将性能维持在约82%的水平,仍需至少256GB统一内存(Unified Memory),或相当规模的RAM/VRAM配置,对普通消费级硬件而言门槛依然较高。

从市场层面看,总部位于北京的Z.ai自2025年1月起已被纳入美国出口管制清单。尽管如此,随着GLM-5.2发布,以及市场对Anthropic模型访问限制的讨论升温,公司股价在最近一周上涨约90%,并创下历史新高。

第三方评测也给出较高评价。Artificial Analysis的Intelligence Index将GLM-5.2列为当前最强的开源AI模型之一,OpenRouter也将其纳入顶级模型阵列。

不过,GLM-5.2与顶级闭源模型之间的差距尚未完全消失。在评估长期高难度任务的SWE-Marathon测试中,GLM-5.2得分为13.0,低于Claude Opus 4.8的26.0。这表明,该模型虽然在长时自主编码任务中已具备较强竞争力,但在需要更复杂推理能力的高难区间仍存在差距。

总体来看,此次发布被视为在缺少美国先进AI芯片支持的情况下,中国企业仍能打造全球第一梯队开源模型的一个案例。随着性能、成本和开放性同步推进,AI生态的竞争重心也正从单一模型能力,延伸至芯片供应链和开源策略。

关键词

#Z.ai #GLM-5.2 #开源模型 #MIT许可证 #Huawei Ascend #Nvidia #FrontierSWE #SWE-bench Pro #100万Token上下文窗口 #MoE
版权所有 © DigitalToday。未经授权禁止转载或传播。