Anthropic、「Claude Mythos」を限定公開　Bruce Schneier氏は透明性不足を指摘

Anthropicは、ソフトウェアの脆弱性を発見・悪用する能力が極めて高いことを理由に、新型AIモデル「Claude Mythos」を約50組織に限定して先行公開した。取り組みは「Project Glasswing」として進める。

Anthropicによると、Mythosは主要OSやブラウザで数千件の脆弱性を見つけた。27年前のOpenBSDのバグや、16年前のFFmpegの欠陥も含まれるとしている。

さらに、MythosはFirefoxで発見した脆弱性を基に、181件の攻撃コードを生成した。Anthropicの従来の主力モデルが2件しか作れなかったのに比べ、大幅な増加だという。

これに対し、暗号学者でセキュリティ専門家のBruce Schneier氏は、自身のWebサイトに掲載した文章で、Anthropicの対応は「セキュリティ研究者が長年求めてきた責任ある公開のあり方に近い」と評価しつつも、「その判断を検証するには情報が少なすぎる」と指摘した。公開されたのは印象的な成功事例だが、Mythosがどの程度の頻度で誤るのかが分からないためだ。

Schneier氏は、Anthropicの説明として、外部のセキュリティ専門家がMythosによる脆弱性の深刻度評価について89%のケースで一致したことに言及しつつ、「印象的ではあるが、それだけでは不十分だ」と述べた。

そのうえで、類似モデルを調べた独立研究者の分析では、実在するバグを高い精度で捉えるAIほど、すでに修正済みの正常なコードに対しても脆弱性があるかのような、もっともらしい誤判定を示す傾向があると説明した。Mythosの誤判定率が分からなければ、89%という数字だけで性能は判断できないという。

同氏は、「数百件の脆弱性を正確に見つけて悪用できるモデルは情勢を一変させ得る。一方で、数千件の誤検知を吐き出すモデルであれば、なお熟練した人間の精査が必要になる」との見方を示した。

誤りの割合が明らかでなければ、Anthropicが公表した事例が全体を代表しているのか、それとも好成績の例だけを選んだのかも判断できないとした。

また、MythosのようなLLMは、学習データに近い入力に対しては高い性能を発揮しやすいと指摘。ソフトウェア分野でいえば、インターネット上でソースコードが公開されているオープンソースプロジェクトや主要ブラウザ、Linuxカーネル、人気のWebフレームワークなどを多く学習しているとみられるという。

このため、初期アクセスの対象をこうした主要ソフトウェアの供給元に絞るのは、攻撃者に先んじてパッチ適用を進められる点で合理的だと評価した。ただし、学習データが乏しい領域に入ると事情は変わるとみる。

Schneier氏は、「産業制御システム、医療機器のファームウェア、独自の金融インフラ、地方銀行のシステム、旧式の組み込みシステムでは、Mythosは脆弱性を見つけにくい」と指摘した。

その一方で、こうした領域に専門知識を持つ攻撃者であれば、Mythosの高度な推論能力を使って、Anthropicのエンジニアが十分な知見を持たないシステムを攻略できる可能性があるとした。問題は、Mythosがその分野で失敗することではなく、専門性を持つ攻撃者の手で成功してしまうことだという。

この非対称性を小さくするには、医療機器セキュリティに詳しい循環器専門医や、制御システムのエンジニア、知名度の低い言語やエコシステムを研究する研究者などにも、早期アクセスの対象を広げるべきだと強調した。

同氏は、「どれほど慎重に選んでも、50組織で研究コミュニティ全体に分散する専門性を代替することはできない」と指摘。そのうえで、「Anthropicは民間企業であり、人員や予算、専門性には限界がある。結果として、どの重要インフラを優先して守るかを一方的に決めることになり、見落としは避けられない」と述べた。

その見落としが病院や電力網のソフトウェアで起きた場合、代償を負うのは意思決定に関与できない人々だとも指摘した。

さらに、AIモデルがもたらすセキュリティリスクはMythosに限らないとも言及した。Schneier氏によると、OpenAIも「GPT-5.3-Codex」は危険性が高いとして一般公開しない方針を示したほか、セキュリティ企業Aisleは、より小型で低コストのオープンソースAIモデルを使って、Anthropicが公表した事例の相当部分を再現したという。

最終的には規制が必要になるものの、適切な制度設計には長い時間と議論を要する。そのため現時点では、Anthropicのような企業が、より広いコミュニティに対して、より多くの情報を共有すべきだというのが同氏の考えだ。

Schneier氏は、「Mythosのような強力なモデルを広く公開すべきだと言っているのではない。社会全体が根拠に基づいて判断できるよう、可能な限り多くのデータと情報を共有すべきだ」と述べた。あわせて、独立監査に向けた国際的な連携枠組みの整備や、集計した性能指標の開示義務化、学術界や市民社会の研究者がアクセスできるようにする支援も求めた。

Chi-gyu Hwang delight@d-today.co.kr

キーワード