GLM-4.7-Flash与其他模型的测试结果对比。图片来源:Z.ai

中国AI公司Z.ai发布轻量级模型GLM-4.7-Flash,并表示其性能已超过OpenAI的GPT-OSS-20B。

据日本科技媒体Gigazine 1月20日报道,基准测试结果显示,GLM-4.7-Flash在推理等核心指标上明显领先GPT-OSS-20B。

GLM-4.7-Flash采用MoE(Mixture of Experts,专家混合)架构,总参数量为300亿,激活参数为30亿。在较低激活参数规模下,该模型仍保持了较强的性能表现。

在与Qwen3-30B-A3B-Thinking-2507和GPT-OSS-20B的对比测试中,GLM-4.7-Flash整体表现更优。这两款模型中,Qwen3-30B-A3B-Thinking-2507总参数为300亿、激活参数为30亿,GPT-OSS-20B总参数为210亿、激活参数为36亿。与此同时,在衡量网页搜索能力的BrowseComp测试中,GLM-4.7-Flash也以明显优势领先其他模型。

GLM-4.7-Flash已以MIT许可证开源发布,并在Hugging Face开放下载。BF16版本需要45GB以上VRAM,适配RTX 4090的量化版本预计将于近期推出。

业内普遍关注的是,GLM-4.7-Flash此次采用MIT许可证开源发布。市场认为,具备自由商用属性的高性能轻量级模型出现,可能对当前由OpenAI等大型厂商主导的市场格局带来影响。

与此同时,市场对其可用性的关注也在升温。目前公开的BF16版本仍需要企业级GPU支持,但随着Z.ai预告的量化版本落地,这一情况可能出现变化。若RTX 4090等消费级显卡也能运行,将有助于降低个人开发者和中小企业的使用门槛,并进一步推动开源生态扩张。

这一案例也反映出,AI技术竞争正从单纯比拼参数规模,转向更重视效率。在体量更小、性能更强的轻量级模型持续出现的背景下,高性能AI在家庭场景的普及节奏或将快于预期。

关键词

#Z.ai #GLM-4.7-Flash #MoE #GPT-OSS-20B #Qwen3-30B-A3B-Thinking-2507 #MIT许可证 #Hugging Face #BF16 #量化版本 #RTX 4090
版权所有 © DigitalToday。未经授权禁止转载或传播。