图片来源:Google

据SiliconANGLE当地时间2日报道,Google发布了开放权重模型系列Gemma 4。

Google表示,Gemma 4采用与Gemini 3相同的架构,可在工作站、智能手机等低功耗设备上本地运行复杂推理,并支持AI代理。

Gemma 4系列共包括四款模型,分别为E2B、E4B、26B Mixture of Experts(MoE)和31B Dense。其中,E2B和E4B主要面向Android智能手机、树莓派(Raspberry Pi)等轻量级硬件设备。26B MoE在推理过程中仅激活38亿个参数,在提升推理速度的同时保留大模型级别的知识能力。

Google称,上述模型原生支持函数调用和结构化JSON输出,可与外部工具联动,便于构建能够执行多步骤任务的AI代理。四款模型均支持图像和视频输入,E2B和E4B还原生支持音频输入,从而在设备端实现实时语音理解。

Gemma 4采用Apache 2.0许可证发布,用户可通过Google Cloud访问,也可在Hugging Face、Kaggle和Ollama等平台获取其开放权重。

关键词

#Google #Gemma 4 #开放权重模型 #Gemini 3 #低功耗设备 #本地推理 #MoE #函数调用 #结构化JSON输出 #多模态输入
版权所有 © DigitalToday。未经授权禁止转载或传播。