GPT-5.4。图片来源:OpenAI

OpenAI发布新一代AI模型GPT-5.4,进一步加码办公场景AI应用。

OpenAI于当地时间5日在官方博客宣布,正式推出最新模型GPT-5.4,并已将其接入ChatGPT、API和Codex。OpenAI表示,GPT-5.4是面向专业工作的最强模型。

从功能定位来看,GPT-5.4将推理、编程和工具调用能力整合为统一系统,重点面向真实办公环境中的复杂任务,提升处理电子表格、演示文稿和文档等工作的准确性与效率。

此次更新的一大亮点是支持“直接操作电脑”。GPT-5.4可根据屏幕截图执行鼠标和键盘操作,从而控制多种软件和网页环境,这也有助于AI代理跨应用完成复杂流程。

在性能方面,GPT-5.4同样有所提升。该模型在评估桌面操作能力的测试中成功率达到75%,明显高于上一代GPT-5.2的47%。同时,其文档理解和图像分析能力也进一步增强,在处理复杂文档和高分辨率图像时准确性更高。

面向开发者,OpenAI还新增“工具搜索(tool search)”功能,使AI能够自行查找并调用所需工具,在控制成本的同时提升响应速度。GPT-5.4还支持最长100万 token的上下文处理能力,进一步提升了对长时、复杂任务的处理表现。

目前,GPT-5.4已在ChatGPT中以“GPT-5.4 Thinking”形式提供,API用户也可通过gpt-5.4调用该模型。与此同时,OpenAI还推出了高性能版本GPT-5.4 Pro。

关键词

#OpenAI #GPT-5.4 #ChatGPT #API #Codex #AI代理 #办公自动化 #工具搜索 #100万 token #桌面操作
版权所有 © DigitalToday。未经授权禁止转载或传播。