OpenAIは5日(現地時間)、最新AIモデル「GPT-5.4」を発表した。ChatGPT、API、Codexで提供し、推論やコーディング、ツール活用を統合したモデルとして、文書作成やPC操作を含む業務自動化への対応を強化する。
同社は公式ブログで、GPT-5.4について、専門的な業務を想定して設計した「最も強力なAIモデル」だと説明した。
新モデルの特徴は、推論能力、コーディング性能、ツール活用能力を単一のシステムに統合した点にある。スプレッドシート、プレゼンテーション、各種文書の作成・処理など、実務で求められる複雑な作業を、より正確かつ効率的にこなせるよう設計したとしている。
新機能として打ち出したのが「コンピュータ直接使用」だ。スクリーンショットをもとに、マウスやキーボードを操作し、各種ソフトウェアやWeb環境を扱える。これにより、複数のプログラムにまたがる作業を自動実行するAIエージェントの実装にも対応する。
性能面でも改善した。デスクトップ環境の操作能力を評価するテストでは、GPT-5.4の成功率は75%となり、従来のGPT-5.2の47%から大きく向上した。文書理解と画像分析の精度も高め、複雑な文書や高解像度画像の処理にも対応する。
開発者向けには、新機能「tool search」も導入した。AIが必要なツールを自ら探索して利用する仕組みで、コストと応答速度の改善につなげる。あわせて、最大100万トークンのコンテキストにも対応し、長時間に及ぶ複雑な処理を支援する。
GPT-5.4は、ChatGPTでは「GPT-5.4 Thinking」として提供する。APIでは「gpt-5.4」モデルとして利用できるほか、高性能版の「GPT-5.4 Pro」も同時に投入した。