Google披露了Gemini 3.5系列的发布时间安排。率先上线的是Gemini 3.5 Flash,而外界关注度较高的Gemini 3.5 Pro预计将于下月发布。
据Engadget和Business Insider报道,Google在美国加州举行的年度开发者大会I/O 2026上发布了Gemini 3.5 Flash,并将其作为Gemini应用和搜索AI模式的默认模型。
从定位来看,Gemini 3.5 Flash强调在速度、成本和性能之间取得平衡。Google表示,该模型主要面向实际AI代理任务和编码场景,在相关任务中的表现目标是优于Gemini 3.1 Pro。Google同时指出,Flash与Flash-Lite并非同一模型,前者定位于比Gemini Pro系列更快、成本更低。
对于需要深度推理和长上下文处理的任务,Google计划在下月推出定位更高的Gemini 3.5 Pro。Google称,Flash与Pro之间的性能差距已经缩小,但目前尚未披露Gemini 3.5 Pro的更多细节。
Google CEO Sundar Pichai在I/O现场表示,知道很多人都希望尽快亲自体验Pro模型,“请大家等到下个月”。不过,Google并未说明Pro延后发布的具体原因。
根据Google公布的基准测试结果,Gemini 3.5 Flash在Terminal-Bench 2.1上的成绩为76.2%,在MCP Atlas扩展工具使用上的成绩为83.6%,在CharXiv Reasoning上的成绩为84.2%。Google还表示,按每秒输出Token计算,其速度约为主流前沿模型的4倍。
Google强调,Gemini 3.5 Flash适合长期运行的AI代理任务。在人工监督下,该模型能够较为稳定地执行多步骤工作流和编码任务。Google称,包括银行和金融科技公司在内的合作伙伴,正将其用于持续数周的业务自动化流程。
Gemini 3.5 Flash将通过Google Antigravity、Google AI Studio中的Gemini API、Android Studio、Gemini Enterprise Agent Platform以及Gemini Enterprise提供,普通用户也可在Gemini应用和搜索AI模式中使用该模型。
个人AI代理Gemini Spark同样由Gemini 3.5 Flash驱动。Google当天已开始向测试者推送,并计划提供一种即便不持续开启笔记本电脑也能运行的AI代理体验。
在安全方面,Google也同步进行了升级。公司表示,已加强对网络安全以及化学、生物、放射性、核(CBRN)相关风险的防范能力,同时降低模型生成有害内容的可能性,并减少对正常请求的不必要拒答。
从产品推进节奏来看,Google在推迟Gemini 3.5 Pro发布的同时,先将更强调速度和成本效率的Flash部署到实际使用场景中。随着同一模型家族逐步覆盖搜索、应用、开发者工具和企业平台,Gemini生态也在进一步扩展。
接下来,市场关注的重点将是下月亮相的Gemini 3.5 Pro将与Flash拉开多大差距。若最终形成“Flash作为默认模型、Pro承担高难度推理与长上下文任务”的分层结构,Google的AI产品策略或将进一步围绕具体使用场景展开。