在AI加速渗透办公场景的背景下,越来越多用户开始用语音替代键盘完成工作,AI口述正迅速成为科技行业新的生产力工具。
据《华尔街日报》报道,在不少科技创业公司里,员工对着电脑“说话办公”已变得越来越常见。以信用卡创企Ramp为例,工程师戴着游戏耳机坐在工位上,并不是为了娱乐,而是为了更清晰地向AI助手发出语音指令。
人力资源平台Gusto联合创始人Edward Kim表示,未来的办公室可能会更像销售大厅。他也鼓励员工尝试将语音实时转换为文字的口述工具。Edward Kim称,自己打字速度并不慢,但最近除非不得已,基本都在通过说话完成工作。
不过,这种工作方式在办公室里仍难免带来些许尴尬。对很多人而言,在工位上持续开口说话并不算习惯;相比之下,在家办公显然更自在。Edward Kim形容,在家使用这类工具时,有点像Tony Stark在和JARVIS对话,而在办公室里则多少会显得别扭。
随着语音办公逐渐普及,如何减少对他人的干扰也成为新问题。报道称,一些用户会刻意压低音量,也有人通过佩戴耳机来降低周围语音输入带来的干扰。
《华尔街日报》还援引一名风险投资人的说法称,他近期走访AI初创公司时,经常看到办公室里到处都有人在和AI进行语音交流,整体氛围像“高端呼叫中心”。
口述并不是新技术,但直到不久前,其实际体验仍难以满足日常办公需求。如今,随着AI能力提升,这一情况正在快速改变。报道称,包括Wispr在内的多款应用,已能够在语音转文字过程中实时润色内容,并改善语法和表达语气。
使用场景扩大的同时,相关硬件需求也在上升。为了提升口述体验,一些重度用户开始添置额外设备:有人购买原本面向游戏场景的可编程脚踏开关,用脚趾启动Wispr;也有人在桌面摆上售价60美元的鹅颈麦克风,这类设备常见于体育解说或教会场景。报道称,LinkedIn联合创始人Reid Hoffman甚至用“voicepilled”形容自己对语音输入的高度依赖。
随着“用语音工作”的用户增加,AI口述应用赛道的竞争也持续升温。除Wispr外,Aqua Voice、Willow、Talktastic、Typeless、Superwhisper等产品也已相继入局。
Google的最新动作进一步引发市场关注。TechCrunch 5月12日(当地时间)报道称,Google已在Android键盘应用Gboard中加入AI口述功能“Rambler”。
按照Google的介绍,Rambler可以自动去除“嗯”“呃”等口头语,也能识别并处理说话过程中临时改口的内容,例如“周三下午3点……不,2点见”。该功能基于Gemini多语种模型,支持在同一句话中切换不同语言,并保持整体语境连贯,例如从英语自然切换到印地语。
随着Rambler上线,Google也将与Wispr、Typeless等AI口述应用展开更直接的竞争。TechCrunch指出,此前大多数口述类应用主要在桌面端和iOS端扩张,Android生态内的竞争相对有限。
相比同类产品,Rambler最大的优势在于分发能力。Gboard是全球大量Android用户的默认键盘,通常以预装方式覆盖海量终端。包括Rambler在内的新功能将于今年夏天率先登陆Samsung Galaxy和Google Pixel机型,随后再扩展至其他Android设备。