OpenAIは、AIエージェントが補助的な処理を担う用途向けに、小型モデル「GPT-5.4 mini」と「GPT-5.4 nano」を発表した。コードベースの検索やファイルレビューなど、高速かつ低コストで並列処理するタスクを主な対象とする。
両モデルは、AIエージェントの中で補助タスクを分担するサブエージェント向けに位置付ける。OpenAIによると、特にGPT-5.4 miniは、コーディングやコンピュータ操作に関する一部ベンチマークでフルモデルに近い性能を示し、処理速度は2倍超に達したという。
The News Stackは、GPT-5.4 miniについて、一部領域ではGPT-5.4のフルモデルとの差が大きくない点に注目した。OpenAIは、miniがコーディングとコンピュータ利用のベンチマークでフルモデルに匹敵する水準を示したとしている。一方、nanoは大規模処理向けに簡素化したモデルで、分類、データ抽出、ランキング、軽量なコーディング支援に適すると説明した。
GPT-5.4 miniはAPIに加え、CodexとChatGPTでも利用できる。コンテキスト長は40万トークンで、テキストと画像の入力に対応する。GPT-5.4 nanoはAPI経由でのみ提供する。
実際のソフトウェアエンジニアリング作業を評価するベンチマーク「SWE-bench Pro」では、GPT-5.4 miniは54.38%を記録し、GPT-5.4フルモデルとの差は3ポイント差にとどまった。コンピュータ利用能力を測る「OSWorld-Verified」では72.13%となり、フルモデルの75.03%に近づいた。nanoはminiより性能面で劣るものの、コーディングとツール呼び出しでは既存のGPT-5 miniを上回った。
OpenAIは、CodexではGPT-5.4が計画立案や調整、最終レビューを担い、GPT-5.4 miniのサブエージェントが並列に動作しながら、コードベース検索や大容量ファイルのレビュー、関連文書の処理といった作業を担当する構成を想定していると説明した。
OpenAIは「この種の環境では、最良のモデルは最も大きいモデルとは限らない。迅速に応答し、ツールを安定して使いこなし、複雑で専門性の高い作業でも高い性能を発揮するモデルが求められる」と強調した。