OpenAIが次期モデル「GPT-5.6」をChatGPT上で非公開テストしているとの見方が広がっている。ChatGPTの一部利用者の間では、生成品質の向上を評価する声が上がる一方、応答や処理にかかる時間が長くなったとの指摘も出ている。
Decryptが今月19日に報じたところによると、Xでは「GPT-5.5 Pro」を選択した一部の有料アカウントで、実際には別モデルが動いている可能性を指摘する投稿が相次いだ。
利用者の報告で共通するのは、出力品質の改善と処理時間の増加だ。Webデザインや3Dゲーム制作では従来より良い結果が得られたとする一方、これまで約10分で終わっていた作業が1時間超に伸びたケースや、20〜40分かかったとする報告も出ている。
開発者のアンシュ・チマラは、ランディングページ生成結果を比較する動画を公開し、初期段階のGPT-5.6(Proとみられる)にアクセスできた利用者の1人だと主張した。Codexを使ったドブロスラフ・ラドサブレビッチも、稼働中のモデルは従来のGPT-5.5とは明らかに異なる印象だと投稿している。
3Dゲーム生成でも同様の反応が出ている。コナー・ダートは、物理演算とカメラ制御を備えたブラウザゲームを単一のプロンプトで生成したとし、所要時間は60分15秒だったと明らかにした。その上で、「完璧ではないが、1つのプロンプトだけでゲーム開発を試した結果としては非常に印象的だ」と評価した。
AI業界のインフルエンサーとして知られるチェタス・ルアも、ロボットシミュレーションと3Dテストで新モデルとみられる結果を確認したと説明。「理解力は以前より大きく伸びたが、作業時間は再び20〜40分かかるようになった」と記した。
もっとも、すべての比較で優位だったわけではない。AIベンチマーク関連アカウントとして知られるクリスは、宇宙船生成のプロンプトで2モデルを比較し、GPT-5.6 Proとみられるモデルは87分、GPT-5.5 Extra Highは34分42秒だったと投稿した。
クリスは、GPT-5.6について「GPT-5.5に比べれば漸進的な改善はあるが、大幅な進化ではない可能性がある」と指摘。「一部ベンチマークでは競合モデルと肩を並べても、明確に上回るとは限らない」との見方を示した。
リーク情報も出回っている。投稿者がパンカジ・クマルとみられるアカウントは、知識の基準時点が2025年12月に更新され、一部テスターが「Juice Value」と呼ぶ推論設定が768から960に引き上げられたとする内容を投稿した。
また、SVGや3Dデザインの生成能力について、特定の課題ではAnthropicの「Fable 5」を上回る可能性があるとの主張も出ている。
現時点でOpenAIは、こうした観測を直接確認していない。ただ、The Informationによると、OpenAIの最高科学責任者ヤクブ・パチョツキは社内で、次のモデルはGPT-5.5より意味のある改善になるとの趣旨の発言をしたとされる。もっとも、これだけでChatGPT内のA/Bテストや公開時期、具体的な仕様まで裏付けるものではない。
こうした見方が強まる背景には、競争環境の変化もある。中国のオープンソースモデル「GLM-5.2」は、長時間のオープンエンド型エンジニアリング課題を評価するFrontierSWEで、Claude Opus 4.8に1点差まで迫り、同試験ではGPT-5.5を上回ったとも報じられた。
一方、Anthropicの主力モデルである「Mythos 5」と「Fable 5」は、米国の統制指針以降、市場での存在感を失っているとされる。上位モデルの空白を背景に、GLM-5.2と未公開のGPT-5.6がそのポジションを狙うとの見方も出ている。
価格競争に発展する可能性も指摘されている。OpenAIは開発者や企業顧客向けのトークン価格引き下げを検討しているとされ、Anthropicも同様の調整に動く可能性があるという。両社が新規株式公開(IPO)を準備している局面にあることも、市場の関心を高めている。
もっとも、実際にリリースされるかどうかはなお不透明だ。Xでは、ChatGPTでGPT-5.5 Proを選択した際、一部アカウントで新モデルが水面下で試験運用されているとの主張が続いており、公開日は25日になるとの観測も出ている。
予測市場のPolymarketでは、22〜28日の間にGPT-5.6が投入される可能性に資金が集まり、関連契約の確率は週内に一時89%まで上昇した。
今回の焦点は、性能向上そのものに加え、実サービス内でのモデル切り替えの可能性を利用者が体感ベースで先に捉えた点にある。OpenAIが応答速度と生成品質をどう両立するのか、競合モデルの空白をどこまで早く埋められるのかが注目される。