Google发布Gemma 4开放权重模型，可在低功耗设备端本地运行复杂推理

生成中...

Chi-gyu Hwang

发布时间 2026-04-03 05:58:39

搜索关键词

据SiliconANGLE当地时间2日报道，Google发布了开放权重模型系列Gemma 4。

Google表示，Gemma 4采用与Gemini 3相同的架构，可在工作站、智能手机等低功耗设备上本地运行复杂推理，并支持AI代理。

Gemma 4系列共包括四款模型，分别为E2B、E4B、26B Mixture of Experts（MoE）和31B Dense。其中，E2B和E4B主要面向Android智能手机、树莓派（Raspberry Pi）等轻量级硬件设备。26B MoE在推理过程中仅激活38亿个参数，在提升推理速度的同时保留大模型级别的知识能力。

Google称，上述模型原生支持函数调用和结构化JSON输出，可与外部工具联动，便于构建能够执行多步骤任务的AI代理。四款模型均支持图像和视频输入，E2B和E4B还原生支持音频输入，从而在设备端实现实时语音理解。

Gemma 4采用Apache 2.0许可证发布，用户可通过Google Cloud访问，也可在Hugging Face、Kaggle和Ollama等平台获取其开放权重。

Chi-gyu Hwang delight@d-today.co.kr