苹果新版 Siri 渲染图流出：采用端云混合架构，部分请求或接入 Gemini

据多家外媒报道，苹果正筹备新版 Siri，并计划推出独立的 Siri 聊天应用，进一步将 AI 能力整合进 iPhone 操作系统。

TechCrunch 等媒体于当地时间 5 月 28 日报道称，在 WWDC 开幕前夕流出的渲染图显示，苹果正重构 Siri，目标是让其具备与 ChatGPT 等 AI 聊天机器人竞争的能力。

从目前披露的信息来看，此次改版的重点，是将 Siri 从传统语音助手升级为 iPhone 的系统级搜索与任务执行入口。用户仍可通过按键唤起 Siri，但回复内容和交互动画将更多出现在 iPhone 顶部的 Dynamic Island 中，以适配快速语音提问和轻量搜索等使用场景。

与此同时，苹果还准备调整 Spotlight 的搜索体验。用户下滑呼出 Spotlight 的交互方式预计将保留，但搜索处理逻辑将由新版 Siri 接管。报道称，重构后的 Siri 将基于新的 AI 模型运行，并据称会引入 Google Gemini 的部分能力：原有搜索框保留不变，但结果由 AI 生成，并可直接执行相应指令。

在这一交互框架下，Siri 不仅可完成信息检索，还能执行打开应用、发送消息、查询天气、添加日程、检索备忘录和运行快捷指令等操作。相关结果将以卡片形式呈现，并与 Dynamic Island 联动。苹果显然希望借此将 Siri 从单一功能，转变为贯穿系统的基础入口。

报道称，苹果还在同步开发独立的 Siri 聊天应用。该应用可查看历史对话，支持文本输入，并允许上传文档和照片。这也被视为苹果试图将 Siri 扩展为独立 AI 聊天服务，以对标 ChatGPT、Anthropic Claude 和 Gemini 等产品。

除界面和产品形态外，Siri 的底层处理架构也可能发生变化。消息称，新版 Siri 预计将采用端云混合架构，在端侧处理部分请求，并将更复杂的任务交由云端完成。苹果过去长期强调端侧 AI 在隐私保护上的优势，但此次改版被认为显示出其正在隐私与性能之间寻求新的平衡。

其中一个重要原因在于智能手机硬件仍存在明显限制。尽管最新芯片的 AI 性能持续提升，但要在终端完整运行大语言模型依然困难重重。一方面，手机内存容量有限，难以承载更大规模的模型；另一方面，端侧模型的参数规模通常仅能控制在数十亿级。相比之下，报道称最新 Gemini 模型的参数规模已达数万亿级。此外，端侧模型为提升运行效率，往往还需经过量化处理，这也可能影响 Token 生成的准确性。

报道指出，Google 虽然同样推出了面向移动端的轻量模型 Gemini Nano，但其优化方向更多集中于上下文摘要、音频处理等相对有限的功能；而 Siri 的定位更接近可理解用户请求并完成实际任务的对话式助手。

据称，苹果采用了一种基于“蒸馏”的思路，将大型云端 Gemini 模型的部分能力迁移到小模型上，以实现简单请求在端侧完成、复杂请求转交云端的分层处理架构。

不过，报道同时指出，苹果自建云基础设施的承载能力或仍有限。虽然苹果已基于搭载 M 系列芯片的 Mac 构建起“Private Cloud Compute”，但若要稳定运行大型 Gemini 模型，系统压力仍然不小。因此，一部分复杂请求可能不会完全通过苹果自有基础设施处理，而是转由 Google Cloud 承接。

在这一体系中，NVIDIA 或将扮演关键角色。消息称，苹果已签约采用 NVIDIA 的“机密计算”平台，而非 Google TPU。该技术可在云端处理数据时，仍将数据保持在 GPU 的加密环境中，从而帮助苹果在提升云端依赖度的同时，尽量维持其一贯强调的隐私保护路线。业内也在讨论，这一体系未来是否仍将沿用 Private Cloud Compute 品牌。

从竞争层面看，苹果的最大优势仍是庞大的用户基础。报道称，ChatGPT 的周活跃用户数约为 9 亿，而包括 iPhone 在内的苹果设备全球装机量约为 25 亿台。借助 Siri，苹果可以直接向大量尚未使用独立 AI 应用的用户提供 AI 能力。

报道认为，此次 Siri 重构更像是苹果的一次 AI 分发体系重组：通过打通 Dynamic Island、Spotlight 搜索以及独立聊天应用，形成一条更顺畅的用户路径，并降低使用门槛。若 WWDC 上的实际发布内容与上述方向一致，Siri 未来或将不再只是语音助手，而会被重新定义为 iPhone 的 AI 入口。

Seung-a Yoo ysah@d-today.co.kr

关键词