搜索关键词 Gemma 4
AI & Enterprise
Google发布Gemma 4 QAT:面向手机和笔记本降低端侧内存需求
Google发布Gemma 4 QAT,将量化模拟前移至训练阶段,以降低模型在手机、轻薄笔记本等设备上的运行内存需求。此次发布覆盖Gemma 4全系,并提供移动端优化型号,免费开放使用,且官方支持llama.cpp、Ollama、LM Studio等本地运行环境。
AI & Enterprise
NVIDIA发布5500亿参数开源大模型Nemotron 3 Ultra,Vera Rubin平台进入量产阶段
NVIDIA发布参数规模达5500亿的开源大模型Nemotron 3 Ultra,并表示将于本周正式开源发布。与此同时,下一代AI服务器平台Vera Rubin也已进入量产阶段,以Rubin GPU和自研Vera CPU为核心,瞄准企业级AI及Agent AI带动的数据中心需求。
AI & Enterprise
实测显示:借助GitHub工具数分钟内可移除Meta、Google开放权重模型安全护栏
测试显示,Meta的Llama 3.3和Google的Gemma 4等开放权重模型,可借助GitHub上公开的工具在短时间内移除安全护栏。安全机制被去除后,模型会回应原本应拒绝的高风险提问。业内担忧,这类去除限制后的衍生模型正在快速扩散,相关监管与治理讨论可能随之升温。