Anthropic“Claude Mythos”加剧安全担忧 AI安全范式或迎重构

Anthropic AI模型“Claude Mythos”引发的安全风险担忧，已引起政府和产业界高度关注。随着能够自主发现漏洞、生成攻击代码并实施利用的AI出现，围绕现有安全应对框架是否需要重估的讨论迅速升温。

本月7日，Anthropic通过“Project Glasswing”计划，以预览形式向12家大型科技公司和40余家重点企业开放Mythos预览版。据介绍，该模型找出了在以高安全性著称的OpenBSD中存在长达27年的漏洞，在漏洞发现和攻击利用方面的表现明显强于现有AI模型。

云安全联盟（CSA）近日发布的《Mythos Ready》报告显示，漏洞从披露到被利用的时间窗口，已从2018年的2.3年大幅缩短至2026年的20小时。CSA认为，在AI加速攻击的背景下，人工响应速度已难以跟上威胁演进。

报告指出，Mythos预览版能够自主发现主流操作系统和浏览器中的严重漏洞，并在无需人工介入的情况下生成可运行的攻击代码，其攻击速度和规模均已超出既有技术水平。

据称，Anthropic曾以Mozilla基金会的Firefox 147的JavaScript引擎为测试对象，对比Claude Opus 4.6与Mythos两款模型的漏洞利用能力。结果显示，Mythos成功181次，而Opus 4.6仅成功2次。

国家层面应对提速，治理体系亟待重塑

随着Mythos在漏洞发现和入侵利用方面的能力受到关注，韩国政府也开始推动应对工作。韩国科学技术信息通信部与韩国金融委员会已召开紧急会议，重点讨论与主要企业协同强化安全政策的方案。国家AI战略委员会也在研究，是否将“自主AI基础模型”项目提升至强化安全能力的层级。

多位专家认为，政府不能停留在风险提示层面，还应进一步强化统筹协调作用，推动漏洞信息共享和应对流程标准化。面对不同于以往的AI安全威胁，整体安全治理体系亟须重新设计。

Soonchunhyang University信息安全系名誉教授Yeom Heung-yeol表示，这一变化可能改写安全行业的游戏规则。过去，漏洞修补通常还留有数月时间窗口，但未来这一周期可能缩短至1天以内，因此必须重建更快速的补丁响应治理机制。

Yeom Heung-yeol进一步指出，关键在于尽可能提前完成彻底的安全修补，这需要国家层面建立起结构化、体系化的应对机制。

Dongguk University国际信息安全研究生院教授Hwang Seok-jin也强调，应对方式必须同步转变。他表示，随着新一代AI持续出现，逐案应对的方式已存在明显局限，更重要的是提前搭建国家层面的应对架构，包括最小权限控制、日志审计以及事故报告体系等。

“用AI对抗AI”成共识，自动化防御被提上日程

在技术应对层面，安全策略调整已被认为不可避免。相较于在既有体系上进行局部修补，业界普遍认为，更需要转向面向AI攻击的自动化防御体系。

Hwang Seok-jin表示，未来安全范式应从依赖人工检查，转向以自动化防御为核心，构建由AI驱动、覆盖检测、研判和响应的一体化自动化闭环。

与此同时，技术能力差距也被视为重要变量。如果高性能AI模型只向特定群体开放，安全能力失衡可能进一步加剧。Iroun & Company代表Yun Du-sik表示，如果缺乏安全约束的Mythos仅向少数群体开放，无法接入这一体系的国家或组织将处于不利位置。

Yun Du-sik还指出，现实中即便漏洞已经出现，许多政府部门或机构仍处于“无法及时打补丁”的状态，操作系统或软件更新滞后、资产管理薄弱，才是更基础也更突出的风险点。他强调，准确掌握并持续管理组织内部的IT资产和漏洞情况，是最基本的应对措施。

另一方面，Anthropic已于本月16日发布Opus 4.7，并下调了部分能力，以与Mythos形成区隔。Anthropic在博客中表示，Opus 4.7的网络安全能力被设计为低于Mythos预览版，训练过程中也同步进行了削弱相关能力的实验。

OpenAI也推出了面向安全漏洞检测优化的“GPT-5.4-Cyber”模型。与Anthropic的做法类似，GPT-5.4-Cyber同样优先向部分专家开放，并设置了相应的安全防护机制。

业界普遍将这一动向解读为，在高性能AI安全风险上升背景下，企业正有意放缓高风险能力的开放节奏。一位安全行业人士表示，Anthropic与OpenAI都清楚模型被滥用后可能产生的影响，两家公司或许正在权衡正式版本的开放范围。

Jin-ho Lee jhlee26@d-today.co.kr