据TechCrunch援引The Information报道,OpenAI正把研发重点转向音频AI,并看好无屏设备的发展方向。
报道称,过去几个月里,OpenAI已整合工程、产品和研究团队资源,对音频模型进行重构,并计划在一年内推出一款以音频交互为核心的个人设备。
从行业动向来看,多家公司也在推进类似布局。Meta为Ray-Ban智能眼镜配备了5个麦克风,以提升嘈杂环境中的语音采集和对话清晰度;Google正在测试“Audio Overview”功能,以对话式摘要形式呈现搜索结果;Tesla则正为车载AI助手“Grok”开发自然语言交互能力,用于导航、空调调节等场景。
初创公司同样在尝试以音频交互为核心的AI硬件。Humane AI Pin主打无屏可穿戴设备,但在耗费大量资金后最终受挫;AI吊坠“Friend”以记录用户生活、提供陪伴功能为卖点,但也引发了隐私争议。
另有一款预计于2026年发布的AI戒指,试图通过手部交互提供新的交互界面。
按照OpenAI的规划,公司将在2026年初推出新一代音频模型,进一步提升语音对话的自然度。报道称,该模型可在实时对话中实现更自然的接话,较现有AI语音交互更接近人与人之间的交流方式。与此同时,OpenAI还在开发以音频交互为核心的设备形态,包括智能眼镜和无屏智能音箱等。
记者信息