英AI安全研究所(AISI)は4月30日、OpenAIの「GPT-5.5」が管理された研究環境で高いサイバー攻撃能力を示したとする報告書を公表した。CTF形式の評価では高難度課題で平均成功率71.4%を記録し、レッドチーム試験では安全対策を回避する手法も確認された。
報告書では、GPT-5.5を2つの方式で評価した。1つ目はCTF方式で、脆弱性の発見や攻撃コードの実行能力を測定した。最難関の課題群では平均成功率が71.4%に達し、比較対象のMythosの68.6%を上回った。
リバースエンジニアリングの課題は10分22秒で解決した。AISIによると、同様の作業には人間のセキュリティ専門家でも約12時間かかる可能性があるという。
2つ目は、実際のネットワーク環境と防御体制を模したサイバーレンジでの評価だ。企業ネットワークへの侵入経路を再現した32段階のシミュレーション「The Last Ones」では、10回の試行のうち2回、自律的に全工程を完了した。
このシミュレーションは、専門家が手作業で実施した場合、約20時間を要する課題として設定された。一方、産業制御システムを標的とした「Cooling Tower」シミュレーションでは、AIモデルはいずれも攻略できなかった。
AISIは、複数のAI開発企業から高い攻撃能力を持つモデルが相次いで現れている点に注目した。論理推論や自律機能の進展がサイバー能力の向上につながるのであれば、近い将来、複数のモデルで同様の性能向上が表れる可能性があるとみている。
今回の結果は、あくまで管理された研究環境での評価であり、一般向けに提供されているGPT-5.5の性能にそのまま結び付くものではない。一般提供版には安全対策が適用されている。
ただ、約6時間に及ぶレッドチーム試験では、安全対策を回避する手法が確認された。用意したすべての悪意あるプロンプトで、有害な応答を引き出せたという。
OpenAIはその後、パッチを適用した。ただ、提供環境の設定上の問題から、最終的な安全性の検証は完了していない。
英国では過去1年間に企業の43%がサイバー攻撃の被害を受けた。英政府は新たな脅威への対応に向け、追加で9000万ポンドを投じ、防御能力の強化を進めている。