OpenAIは2月10日、コーディング向けの新AIモデル「GPT-5.3 Codex」を発表した。AIコーディング分野で先行するAnthropicに対抗し、開発支援機能の強化を打ち出した。
同社によると、GPT-5.3 Codexは、GPT-5.2とコーディング特化モデルのGPT-5.2 Codexを統合したモデル。コード生成やレビューに加え、開発者がコンピュータ上で行う作業の大半を実行できるとしている。
特徴の1つが、「エージェント型コーディング(agentic coding)」への対応だ。単に指示されたコードを生成する従来型のAIとは異なり、Codexは開発者のように自律的に判断しながら作業を進めるという。
具体的には、コードの作成に加え、テストの実行、エラー修正、Jiraのチケット更新、技術文書の作成、デプロイパイプラインの管理まで自律的に処理できるとしている。
OpenAIは、自社開発での活用事例も紹介した。初期版モデルが自己学習プロセスを自らデバッグし、トラフィック変動に応じてGPUクラスタを拡張するスクリプトを作成したといい、「開発速度を大幅に高められる」と説明している。
性能面では、多言語ソフトウェアエンジニアリング評価の「SWE-bench Pro」で56.8%、ターミナル命令の実行能力を測る「Terminal-bench 2.0」で77.3%を記録した。OpenAIは、従来のGPT-5.2 Codexの64.0%から7.2ポイント低下したとしている。
推論速度は25%向上した。より少ないトークンで同等の作業を実行できるようになり、コストと遅延の双方を抑えたと強調した。
OpenAIがAIコーディング分野で攻勢を強めるなか、Anthropicとの競争も激しさを増している。
Anthropicは昨年、コーディング支援機能「Claude Code」を投入し、市場での存在感を高めてきた。Claude Codeの年換算売上高はすでに10億ドル(約1500億円)を超えたとしている。
活用範囲も、単純なコード生成にとどまらない。データ移行やバグ修正、プロトタイプ作成などに広がっており、エンジニアだけでなく一部の非開発者も実務で利用しているという。競合にあたるGoogleのエンジニアもClaude Codeを使っていると伝えられている。
こうしたなかAnthropicは最近、100トークンのコンテキストウィンドウに対応するAIモデル「Claude Opus 4.6」を発表した。同モデルは、開発者向けツールの「Claude Code」と、非開発者向け自動化ツールの「Claude CoWork」の両方で利用できるという。
Anthropicは、計画をより慎重に立てられることに加え、大規模コードベースでも安定して動作し、コードレビューやデバッグ時に自らのミスを検知できる点を挙げ、コーディング性能の向上を訴えた。
注目機能として示したのが「エージェントチーム」だ。複数のAIエージェントがフロントエンド、API、マイグレーション作業をそれぞれ分担し、並列で進める仕組みという。
製品責任者のスコット・ホワイト氏は、「人間のチームのように作業を分担し、より速く協業する」と説明した。ただ、この機能はClaude Codeの研究プレビューとしてのみ提供される。