据SiliconANGLE当地时间2日报道,Google发布了开放权重模型系列Gemma 4。
Google表示,Gemma 4采用与Gemini 3相同的架构,可在工作站、智能手机等低功耗设备上本地运行复杂推理,并支持AI代理。
Gemma 4系列共包括四款模型,分别为E2B、E4B、26B Mixture of Experts(MoE)和31B Dense。其中,E2B和E4B主要面向Android智能手机、树莓派(Raspberry Pi)等轻量级硬件设备。26B MoE在推理过程中仅激活38亿个参数,在提升推理速度的同时保留大模型级别的知识能力。
Google称,上述模型原生支持函数调用和结构化JSON输出,可与外部工具联动,便于构建能够执行多步骤任务的AI代理。四款模型均支持图像和视频输入,E2B和E4B还原生支持音频输入,从而在设备端实现实时语音理解。
Gemma 4采用Apache 2.0许可证发布,用户可通过Google Cloud访问,也可在Hugging Face、Kaggle和Ollama等平台获取其开放权重。
记者信息