Anthropicが開発中とされる新型AIモデル「Claude Mythos」を巡り、攻撃者の手に渡った場合、脆弱性の発見から悪用までの速度が防御側の対応を上回る恐れがあるとして、サイバーセキュリティ業界で警戒感が強まっている。
海外メディアの報道によると、Anthropicが誤って公開し、その後削除したとされる「Claude Mythos」に関するブログ草稿の中で、こうした懸念が示されていたという。
The Informationによれば、Anthropicはサイバーセキュリティ研究者に「Mythos」モデルを事前提供し、意見を集めている。同モデルは、コード生成やコードレビューの能力が従来モデルより高いとされる。
クラウドセキュリティ企業Wizも、これまでAnthropicのモデルを検証してきた経験を踏まえ、Claude Mythosの評価に乗り出す計画だ。
Wizの最高技術責任者(CTO)、アミ・ルトワク氏は「新モデルは、事実上、世界最高水準のサイバーセキュリティ研究者並みの能力を持つ」と述べた。Anthropicがセキュリティ企業に事前アクセスを認めたことについても、「何が起こり得るのかを研究者が理解するうえで極めて重要な措置だ」と評価した。
Anthropicの研究者、ニコラス・カーリーニ氏は今年3月のセキュリティ会議で、「Claude Code」を使ってオープンソースのニュースレタープラットフォーム「Ghost」を分析した結果を公表した。
The Informationによると、Ghostでは13年間、深刻な脆弱性の報告はなかったが、Claude Codeは数時間のうちに、攻撃者がユーザーのWebサイトに侵入して内容を改ざんしたり、個人情報を盗み出したりできる脆弱性を見つけたという。
AIは脆弱性の発見にとどまらず、侵入後の攻撃プロセスも加速させている。侵入先ネットワークの迅速な把握やデータの窃取に加え、防御側が対処する前に暗号化まで終えることも可能だとされる。
AIセキュリティのスタートアップIrregular Securityの創業者、ダー・ラハブ氏は、主要なAIモデルが企業ネットワーク内で検知を回避しながら移動する手法を把握していると指摘した。UiPathの最高情報セキュリティ責任者(CISO)、スコット・ロバーツ氏も、「攻撃者がAIを活用する事例が増えていることは認識している」としたうえで、「電気の発明に匹敵する変化だ」と述べた。
一方、AIを活用した攻撃を防ぐセキュリティツールも、AnthropicやOpenAIなど、攻撃者側が利用し得るものと同種のモデルを基盤としている。The Informationによると、セキュリティ企業は、一般公開版とは異なりハッキング関連の依頼にも応じる制限のない「ungated」版への特別アクセスを申請し、顧客の防御体制の弱点を事前に見つける用途に活用しているという。