2026年FIFAワールドカップ(写真=FIFA)

7つのAIモデルに2026年W杯の優勝国を予想させたところ、4モデルがスペイン、3モデルがアルゼンチンを優勝候補の筆頭に挙げた。上位評価はおおむね共通したものの、最終的な優勝予想は一致しなかった。

Decryptが8日(現地時間)に伝えた内容だ。実験では、すべてのAIモデルがスペイン、アルゼンチン、フランスを有力国と位置付けた一方、優勝国の見立ては二分された。

対象となったのは、AnthropicのOpus 4.8 Max、OpenAIのGPT-5.5、DeepSeek v4 Pro、Stepfun 3.7、NVIDIAのNemotron 3 Ultra、Minimax 2.7、Qwen 3.5の7モデル。各モデルには、48チーム・12組による大会形式とトーナメントの組み合わせ表を共通条件として与え、分析手法は各モデルに任せた。

スペインを優勝と予想したのは、Opus 4.8 Max、GPT-5.5、Stepfun 3.7、Nemotron 3 Ultraの4モデルだ。Stepfun 3.7は5万回のシミュレーションを実施し、スペインの優勝確率を33%と算出した。Opus 4.8 Maxはスペインがフランスを下して優勝すると予想。GPT-5.5は選手層や戦術、決定力、控えを含む戦力、組み合わせを総合評価し、スペイン優位と判断した。

一方、アルゼンチンを最有力とみたのはDeepSeek v4 Pro、Minimax 2.7、Qwen 3.5の3モデル。DeepSeek v4 Proは定性的な分析を基に、アルゼンチン対フランスの決勝を予想した。Minimax 2.7も同カードが決勝になる可能性を示したが、最終的な勝者は断定しなかった。Qwen 3.5は事実と推定を切り分けたうえで、アルゼンチンを本命に据えた。

予想が割れた主因は、戦力評価そのものよりも、各モデルがどのデータを重視したかにあったという。サッカーのリアルタイムEloレーティングでスペインが首位にある点を重視したモデルは、スペインを優勝候補とした。一方、FIFAランキングや2022年W杯での実績をより重くみたモデルは、アルゼンチンを優位にみる傾向があった。

分析アプローチにも違いがあった。Opus 4.8 Maxはディクソン・コールズ・モデルとモンテカルロ・シミュレーションを用い、暑さや高地、長距離移動といった開催条件も加味した。GPT-5.5は優勝確率をレンジで示し、Stepfun 3.7はEloベースのシミュレーションを繰り返して、スペインの優勝可能性を最も高く評価した。

一部のモデルでは弱点も露呈した。DeepSeek v4 Proでは監督情報の一部やランキング情報が古く、Qwen 3.5では組み合わせに誤りが見つかった。同じ条件を与えても、どの資料を信頼し、どう検証するかによって、予想結果だけでなく誤りの生じやすさも変わり得ることが浮き彫りになった。

予測市場の動きは、AIの多数意見に比較的近かった。Dastanが運営する予測市場Myriadでは、7日時点でスペインが19%で首位、フランスが17%で2位。アルゼンチンは10%にとどまり、一部AIモデルの予想より低い評価となった。

今回の実験は、AI予測が単一の正解を示すというより、用いるデータや評価基準によって異なる結論に至ることを示した。7モデルはいずれもスペイン、アルゼンチン、フランスを有力視したが、Eloレーティング、FIFAランキング、過去実績、組み合わせ、開催条件のどれを重視するかで、優勝予想は分かれた。

AIによるスポーツ予測では、的中率だけでなく、結論の根拠をどこまで示せるか、データの誤りをどう抑えるか、不確実性をどれだけ透明に提示できるかが、今後の信頼性を左右する要素になりそうだ。

キーワード

#AI #2026年ワールドカップ #スペイン #アルゼンチン #FIFA #Eloレーティング #予測市場
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.