Anthropicの「Claude Mythos Preview」が、英国のAIセキュリティ研究所(AISI)の評価で専門家向けサイバーセキュリティ課題の正答率73%を記録し、企業ネットワーク攻撃シミュレーションでも10回中3回で全工程を完了した。限定公開中のモデルながら、技術業界や政策当局の間ではリスクへの警戒も広がっている。
BeInCryptoが14日に報じたところによると、英科学・イノベーション・技術省傘下のAISIはこのほど公表した評価で、Claude Mythos Previewが従来のAIでは突破できなかった専門家向けの高度な攻撃課題で有意な性能を示したと明らかにした。
評価結果の公表は、Anthropicが7日にClaude Mythos Previewを発表した直後に行われた。Anthropicは同モデルを一般公開しておらず、一部のセキュリティ研究企業に限定して提供している。
Anthropicは発表文で、同モデルがとりわけコンピュータセキュリティ分野で高い性能を示したと説明。「世界で最も重要なソフトウェアをより安全にし、業界に必要な対応策を整えるため、Project Glasswingを始動した」としている。
評価は2段階で実施された。まず、脆弱性を見つけて隠されたフラグを取得するCTF形式の課題では、専門家レベルの問題で正答率73%を記録した。AISIによると、2025年4月以前にこの評価を通過したモデルはなかったという。
もう一つは、TLOと呼ばれる32段階の企業ネットワーク攻撃シミュレーションだ。人間のセキュリティ専門家が取り組むと、完了までに約20時間を要する課題とされる。
Claude Mythos Previewは10回の試行のうち3回で全工程を完了した。平均到達段階は32段階中22段階で、比較対象の「Claude Opus 4.6」は平均16段階にとどまった。
一方で研究陣は、こうした結果をそのまま現実の脅威に結び付けるべきではないと強調した。特定のサイバーレンジで成功したことは、既にネットワークへのアクセス権を確保し、防御の弱い小規模企業のシステムに対して自律的に攻撃できる最低限の能力を示す一方、試験環境は現実より容易な標的になるよう設計されているため、実環境とは差があるとしている。
Anthropicは独自評価の結果も公表した。利用者が明示的に指示した場合、Claude Mythos Previewは主要OSと代表的なWebブラウザ全般でゼロデイ脆弱性を発見し、悪用可能だったという。
ただ、同社は「発見した脆弱性の99%以上は未修正であり、詳細を公開するのは無責任だ」とも付け加えた。
同モデルはなお限定公開にとどまるが、既に技術業界と政策分野の注目を集めている。ロイターは複数の関係者の話として、スコット・ベセント米財務長官とジェローム・パウエル米連邦準備制度理事会(Fed)議長が主要銀行の最高経営責任者(CEO)らと緊急会合を開き、同モデルに関連するリスクについて警告したと報じた。
AISIは、企業が優先的に講じるべき対策も示した。定期的なパッチ適用、厳格なアクセス制御、セキュリティ設定の強化、包括的なログ取得といった基本対策の徹底を求めている。AIモデルの攻撃能力がどの程度の速さで実運用に影響を及ぼすのか、また限定公開の段階で企業がどこまで迅速に防御体制を整えられるのかが、今後の焦点となりそうだ。