Z.ai发布轻量级模型GLM-4.7-Flash，多项基准测试领先GPT-OSS-20B

生成中...

Yoonseo Lee

发布时间 2026-01-20 16:05:00

搜索关键词

中国AI公司Z.ai发布轻量级模型GLM-4.7-Flash，并表示其性能已超过OpenAI的GPT-OSS-20B。

据日本科技媒体Gigazine 1月20日报道，基准测试结果显示，GLM-4.7-Flash在推理等核心指标上明显领先GPT-OSS-20B。

GLM-4.7-Flash采用MoE（Mixture of Experts，专家混合）架构，总参数量为300亿，激活参数为30亿。在较低激活参数规模下，该模型仍保持了较强的性能表现。

在与Qwen3-30B-A3B-Thinking-2507和GPT-OSS-20B的对比测试中，GLM-4.7-Flash整体表现更优。这两款模型中，Qwen3-30B-A3B-Thinking-2507总参数为300亿、激活参数为30亿，GPT-OSS-20B总参数为210亿、激活参数为36亿。与此同时，在衡量网页搜索能力的BrowseComp测试中，GLM-4.7-Flash也以明显优势领先其他模型。

GLM-4.7-Flash已以MIT许可证开源发布，并在Hugging Face开放下载。BF16版本需要45GB以上VRAM，适配RTX 4090的量化版本预计将于近期推出。

业内普遍关注的是，GLM-4.7-Flash此次采用MIT许可证开源发布。市场认为，具备自由商用属性的高性能轻量级模型出现，可能对当前由OpenAI等大型厂商主导的市场格局带来影响。

与此同时，市场对其可用性的关注也在升温。目前公开的BF16版本仍需要企业级GPU支持，但随着Z.ai预告的量化版本落地，这一情况可能出现变化。若RTX 4090等消费级显卡也能运行，将有助于降低个人开发者和中小企业的使用门槛，并进一步推动开源生态扩张。

这一案例也反映出，AI技术竞争正从单纯比拼参数规模，转向更重视效率。在体量更小、性能更强的轻量级模型持续出现的背景下，高性能AI在家庭场景的普及节奏或将快于预期。

Yoonseo Lee yslee@d-today.co.kr