中国人工智能公司Z.ai(原Zhipu AI)发布新一代开源大语言模型GLM-5.2。该公司称,这款模型在性能上已接近Anthropic旗舰产品,并在成本和开放性方面打出差异化优势,引发业界关注。
据加密货币媒体Decrypt 6月18日(当地时间)报道,Z.ai表示,GLM-5.2在多项编程和Agent基准测试中跻身全球第一梯队。
其中,在评估长周期自主软件开发能力的FrontierSWE基准测试中,GLM-5.2得分为74.4,接近Claude Opus 4.8的75.1,高于GPT-5.5的72.6。
在衡量GitHub Issue解决能力的SWE-bench Pro测试中,GLM-5.2得分62.1,也高于GPT-5.5的58.6和上一代GLM-5.1的58.4。
除性能表现外,市场更关注其训练基础设施。Z.ai称,GLM-5.2训练全程基于Huawei Ascend AI加速器,未使用Nvidia硬件。
在美国持续收紧对华先进半导体出口管制的背景下,这一表述被外界视为,中国企业依托本土AI基础设施,仍有能力开发接近全球顶尖水平的模型。
在发布和分发策略上,GLM-5.2采用MIT许可证开源,未设置国家或地区使用限制。开发者可通过Hugging Face直接下载模型权重,官方同时提供量化版本。
Z.ai还表示,其编程服务用户无需排队,即可直接选择“GLM-5.2”模型使用,平台并提供带有限制的免费体验。
长上下文能力也是开发者关注的重点。GLM-5.2支持最高100万Token上下文窗口,较GLM-5.1的20万Token提升至5倍,可用于一次性分析大型代码仓库、跨文件重构以及复杂AI Agent工作流等场景。该模型采用混合专家架构(MoE,Mixture of Experts),参数规模达到7440亿。
价格方面,GLM-5.2的API定价为输入每100万Token 1.40美元、输出每100万Token 4.40美元,明显低于Claude Opus 4.8输入每100万Token 5美元、输出每100万Token 25美元的水平。其编程服务套餐月费约18美元起,并可适配Claude Code、Cline、Kilo Code等主流开发工具。
本地部署也是其卖点之一。AI优化公司Unsloth AI已将GLM-5.2量化为2-bit GGUF格式,将原始1.51TB的体积压缩至约238GB。不过,若要将性能维持在约82%的水平,仍需至少256GB统一内存(Unified Memory),或相当规模的RAM/VRAM配置,对普通消费级硬件而言门槛依然较高。
从市场层面看,总部位于北京的Z.ai自2025年1月起已被纳入美国出口管制清单。尽管如此,随着GLM-5.2发布,以及市场对Anthropic模型访问限制的讨论升温,公司股价在最近一周上涨约90%,并创下历史新高。
第三方评测也给出较高评价。Artificial Analysis的Intelligence Index将GLM-5.2列为当前最强的开源AI模型之一,OpenRouter也将其纳入顶级模型阵列。
不过,GLM-5.2与顶级闭源模型之间的差距尚未完全消失。在评估长期高难度任务的SWE-Marathon测试中,GLM-5.2得分为13.0,低于Claude Opus 4.8的26.0。这表明,该模型虽然在长时自主编码任务中已具备较强竞争力,但在需要更复杂推理能力的高难区间仍存在差距。
总体来看,此次发布被视为在缺少美国先进AI芯片支持的情况下,中国企业仍能打造全球第一梯队开源模型的一个案例。随着性能、成本和开放性同步推进,AI生态的竞争重心也正从单一模型能力,延伸至芯片供应链和开源策略。