据多家外媒报道,苹果正筹备新版 Siri,并计划推出独立的 Siri 聊天应用,进一步将 AI 能力整合进 iPhone 操作系统。
TechCrunch 等媒体于当地时间 5 月 28 日报道称,在 WWDC 开幕前夕流出的渲染图显示,苹果正重构 Siri,目标是让其具备与 ChatGPT 等 AI 聊天机器人竞争的能力。
从目前披露的信息来看,此次改版的重点,是将 Siri 从传统语音助手升级为 iPhone 的系统级搜索与任务执行入口。用户仍可通过按键唤起 Siri,但回复内容和交互动画将更多出现在 iPhone 顶部的 Dynamic Island 中,以适配快速语音提问和轻量搜索等使用场景。
与此同时,苹果还准备调整 Spotlight 的搜索体验。用户下滑呼出 Spotlight 的交互方式预计将保留,但搜索处理逻辑将由新版 Siri 接管。报道称,重构后的 Siri 将基于新的 AI 模型运行,并据称会引入 Google Gemini 的部分能力:原有搜索框保留不变,但结果由 AI 生成,并可直接执行相应指令。
在这一交互框架下,Siri 不仅可完成信息检索,还能执行打开应用、发送消息、查询天气、添加日程、检索备忘录和运行快捷指令等操作。相关结果将以卡片形式呈现,并与 Dynamic Island 联动。苹果显然希望借此将 Siri 从单一功能,转变为贯穿系统的基础入口。
报道称,苹果还在同步开发独立的 Siri 聊天应用。该应用可查看历史对话,支持文本输入,并允许上传文档和照片。这也被视为苹果试图将 Siri 扩展为独立 AI 聊天服务,以对标 ChatGPT、Anthropic Claude 和 Gemini 等产品。
除界面和产品形态外,Siri 的底层处理架构也可能发生变化。消息称,新版 Siri 预计将采用端云混合架构,在端侧处理部分请求,并将更复杂的任务交由云端完成。苹果过去长期强调端侧 AI 在隐私保护上的优势,但此次改版被认为显示出其正在隐私与性能之间寻求新的平衡。
其中一个重要原因在于智能手机硬件仍存在明显限制。尽管最新芯片的 AI 性能持续提升,但要在终端完整运行大语言模型依然困难重重。一方面,手机内存容量有限,难以承载更大规模的模型;另一方面,端侧模型的参数规模通常仅能控制在数十亿级。相比之下,报道称最新 Gemini 模型的参数规模已达数万亿级。此外,端侧模型为提升运行效率,往往还需经过量化处理,这也可能影响 Token 生成的准确性。
报道指出,Google 虽然同样推出了面向移动端的轻量模型 Gemini Nano,但其优化方向更多集中于上下文摘要、音频处理等相对有限的功能;而 Siri 的定位更接近可理解用户请求并完成实际任务的对话式助手。
据称,苹果采用了一种基于“蒸馏”的思路,将大型云端 Gemini 模型的部分能力迁移到小模型上,以实现简单请求在端侧完成、复杂请求转交云端的分层处理架构。
不过,报道同时指出,苹果自建云基础设施的承载能力或仍有限。虽然苹果已基于搭载 M 系列芯片的 Mac 构建起“Private Cloud Compute”,但若要稳定运行大型 Gemini 模型,系统压力仍然不小。因此,一部分复杂请求可能不会完全通过苹果自有基础设施处理,而是转由 Google Cloud 承接。
在这一体系中,NVIDIA 或将扮演关键角色。消息称,苹果已签约采用 NVIDIA 的“机密计算”平台,而非 Google TPU。该技术可在云端处理数据时,仍将数据保持在 GPU 的加密环境中,从而帮助苹果在提升云端依赖度的同时,尽量维持其一贯强调的隐私保护路线。业内也在讨论,这一体系未来是否仍将沿用 Private Cloud Compute 品牌。
从竞争层面看,苹果的最大优势仍是庞大的用户基础。报道称,ChatGPT 的周活跃用户数约为 9 亿,而包括 iPhone 在内的苹果设备全球装机量约为 25 亿台。借助 Siri,苹果可以直接向大量尚未使用独立 AI 应用的用户提供 AI 能力。
报道认为,此次 Siri 重构更像是苹果的一次 AI 分发体系重组:通过打通 Dynamic Island、Spotlight 搜索以及独立聊天应用,形成一条更顺畅的用户路径,并降低使用门槛。若 WWDC 上的实际发布内容与上述方向一致,Siri 未来或将不再只是语音助手,而会被重新定义为 iPhone 的 AI 入口。