Anthropicが「Claude Mythos」と呼ばれる新たなサイバーセキュリティ特化モデルをテストしているとの報道を受け、セキュリティ関連銘柄が下落した。AIの高度化によって既存のセキュリティ製品需要が細るとの見方が広がったためだ。
海外メディアによると、Claude Mythosはコーディング、学術推論、サイバーセキュリティなど複数の評価項目で、従来の最上位モデルとされる「Claude Opus 4.6」を大きく上回るスコアを記録したという。
これに対し、Boldstart Ventures創業者のエド・シム氏は、AIモデルの進化はセキュリティ業界にとって脅威ではなく、むしろ追い風になるとの見方を示した。AIが高度化するほど、サイバー脅威も同時に拡大するためだ。
シム氏は、Anthropic自身がClaude Mythosについて「前例のないサイバーセキュリティリスク」をもたらし得ると評価している点に注目する。これはモデルそのものの危険性を指すのではなく、悪用された場合にサイバー攻撃の水準がこれまでになく高まる可能性を示したものだという。
シム氏は「Claudeがサイバーセキュリティ業界を壊すのではない。むしろ市場を拡大させている」と述べ、「AIを使った攻撃技術はすでに現実のものになっている」と指摘した。
具体例として挙げたのが、OpenAIやAnthropic、Googleなど主要AIサービスのAPI接続を担うライブラリ「LiteLLM」に対する最近のサプライチェーン攻撃だ。
同氏によると、TeamPCPは「hackerbot-claw」というツールを使い、AIエージェントで標的選定を自動化していた。研究者の間では、AIエージェントがサプライチェーン攻撃に実際に投入された初期の事例の一つとみられているという。
また、この攻撃を最初に見つけたのはAIではなく人間だった点も重要だと強調した。
シム氏は、FutureSearchの開発者であるキャラム・マクマホン氏が、悪性ペイロードによるシステム障害を確認したことで侵害に気付いたと説明した。自動スキャナーは、正規の管理者認証情報と有効なpipハッシュに惑わされ、検知できなかったとしている。
そのうえで今回の事例は、セキュリティ対策における多層防御の重要性を示していると述べた。LLM単体では防御に限界があるという認識だ。
シム氏は「LLMがコードベースから脆弱性を500件見つけたとしても、それが本当に脆弱性なのか、すでに報告済みなのか、優先順位は適切なのかは別の問題だ」と指摘した。米サンフランシスコで開かれたセキュリティカンファレンス「RSAC」で接したCISOの多くは、LLMベースの検知と決定論的な検証を組み合わせる多層的なアプローチを採っていたという。広範囲を高速に洗い出すAIと、脆弱性を確定して修正につなげる検証の両方が必要だとの考えを示した。
シム氏は、今年のRSACで浮上した主要テーマにも言及した。最大のキーワードは「エージェント」だという。
同氏によれば、CISOが最も強い懸念を示したのはAIエージェントのアイデンティティ管理と権限範囲だ。目標達成のために必要なツールを自律的に選択して利用するエージェントの性質上、権限設定を一度誤ると、被害範囲がどこまで広がるか見通しにくくなるとした。
加えて、アラート対応や権限承認の疲弊も課題として浮上している。エージェントごとに細かな権限ポリシーを設定すると、新たな作業が発生するたびに人手による承認が必要になり、運用負荷が増すためだ。
AIベースの攻撃が急速に高速化している点も見逃せない。シム氏は、平均ブレークアウトタイムが48分から29分に短縮され、完全自動化された攻撃では27秒にまで縮んだと紹介した。ブレークアウトタイムは、攻撃者がシステムの一地点に侵入してから、内部の別のシステムへ横展開するまでの時間を指す。