OpenAI发布GPT-5.4：强化办公任务处理，支持直接操作电脑

生成中...

Hyunwoo Choo

发布时间 2026-03-06 07:56:46

搜索关键词

OpenAI发布新一代AI模型GPT-5.4，进一步加码办公场景AI应用。

OpenAI于当地时间5日在官方博客宣布，正式推出最新模型GPT-5.4，并已将其接入ChatGPT、API和Codex。OpenAI表示，GPT-5.4是面向专业工作的最强模型。

从功能定位来看，GPT-5.4将推理、编程和工具调用能力整合为统一系统，重点面向真实办公环境中的复杂任务，提升处理电子表格、演示文稿和文档等工作的准确性与效率。

此次更新的一大亮点是支持“直接操作电脑”。GPT-5.4可根据屏幕截图执行鼠标和键盘操作，从而控制多种软件和网页环境，这也有助于AI代理跨应用完成复杂流程。

在性能方面，GPT-5.4同样有所提升。该模型在评估桌面操作能力的测试中成功率达到75%，明显高于上一代GPT-5.2的47%。同时，其文档理解和图像分析能力也进一步增强，在处理复杂文档和高分辨率图像时准确性更高。

面向开发者，OpenAI还新增“工具搜索（tool search）”功能，使AI能够自行查找并调用所需工具，在控制成本的同时提升响应速度。GPT-5.4还支持最长100万 token的上下文处理能力，进一步提升了对长时、复杂任务的处理表现。

目前，GPT-5.4已在ChatGPT中以“GPT-5.4 Thinking”形式提供，API用户也可通过gpt-5.4调用该模型。与此同时，OpenAI还推出了高性能版本GPT-5.4 Pro。

Hyunwoo Choo cookinpapa@d-today.co.kr