OpenAI发布新一代AI模型GPT-5.4,进一步加码办公场景AI应用。
OpenAI于当地时间5日在官方博客宣布,正式推出最新模型GPT-5.4,并已将其接入ChatGPT、API和Codex。OpenAI表示,GPT-5.4是面向专业工作的最强模型。
从功能定位来看,GPT-5.4将推理、编程和工具调用能力整合为统一系统,重点面向真实办公环境中的复杂任务,提升处理电子表格、演示文稿和文档等工作的准确性与效率。
此次更新的一大亮点是支持“直接操作电脑”。GPT-5.4可根据屏幕截图执行鼠标和键盘操作,从而控制多种软件和网页环境,这也有助于AI代理跨应用完成复杂流程。
在性能方面,GPT-5.4同样有所提升。该模型在评估桌面操作能力的测试中成功率达到75%,明显高于上一代GPT-5.2的47%。同时,其文档理解和图像分析能力也进一步增强,在处理复杂文档和高分辨率图像时准确性更高。
面向开发者,OpenAI还新增“工具搜索(tool search)”功能,使AI能够自行查找并调用所需工具,在控制成本的同时提升响应速度。GPT-5.4还支持最长100万 token的上下文处理能力,进一步提升了对长时、复杂任务的处理表现。
目前,GPT-5.4已在ChatGPT中以“GPT-5.4 Thinking”形式提供,API用户也可通过gpt-5.4调用该模型。与此同时,OpenAI还推出了高性能版本GPT-5.4 Pro。
记者信息