Google面向iPhone用户推出一款AI听写应用,可在离线状态下完成语音转写,并对口语内容进行实时整理,这一新产品近期引发外界关注。
据TechRadar当地时间8日报道,这款名为Google AI Edge Eloquent的应用,不仅能够实时转写用户语音,还会自动删除口头禅和冗余表达,将内容整理为更通顺、更适合阅读的文本。
该应用基于Google的Gemma语音识别模型,现阶段免费提供。其最大特点在于支持离线使用。与依赖网络连接的语音备忘录或自动转写服务不同,AI Edge Eloquent在无网环境下也可完成听写。
从产品定位来看,这款应用并不强调逐字逐句还原,而是更侧重将口语直接整理成可读文本。应用会在转写过程中清理日常对话中常见的“嗯”“呃”等语气词,几乎可在用户说话的同时完成初步整理。
在个性化设置方面,应用可从Gmail读取姓名或常用术语,也支持用户添加独立词库,以提升转写和整理效果。
除基础转写外,应用还提供“改写”功能,可对听写结果进行二次整理,支持“核心要点”“正式语气”“更短”“更长”等不同模式。
从实际体验来看,该应用将语音备忘录直接整理为成稿式文本的能力较为突出。用户在行走过程中口述想法后,应用会先生成初步转写结果,约10秒后再输出更流畅的润色版本,类似于“原始转写结果”与“整理后版本”的区别,但整体处理过程几乎与口述同步进行。
改写功能则更偏向按场景调整表达方式。例如,选择“核心要点”后,简短备忘录会被压缩为若干条要点;选择“正式语气”后,个人记录会被改写为更适合工作场景的表达。报道举例称,用户输入一条用于确认日程的短消息后,应用可将其补写为更完整、更加工整的邮件式句子。
不过,AI Edge Eloquent并不是一款强调“原样保留”语音内容的记录工具。只要语义能够被理解,即便原始表达并不完整,系统也会自动校正,并在必要时补全语句衔接。因此,这款应用更适合不追求逐字精确记录的使用场景。
报道称,这一设计瞄准的是“将语音备忘录直接变成初稿”的需求。相比手写记录,用户可通过口述更快输出想法,并同步完成文字整理;但若需要像会议纪要那样完整保留发言内容,该应用可能并不适用。
目前,AI Edge Eloquent已在Apple App Store上架,但仅限美国区提供下载。Google本周并未对该应用进行大规模发布,而是以独立App形式,率先向iPhone用户提供离线AI语音输入能力。
此外,Google在相关介绍中表示,借助Google AI Edge,开发者可将Gemma 4的能力带到端侧,相关能力可在Gallery应用中进行实验,也可通过LiteRT-LM部署到笔记本、手机和IoT设备。