Anthropic AI模型“Claude Mythos”引发的安全风险担忧,已引起政府和产业界高度关注。随着能够自主发现漏洞、生成攻击代码并实施利用的AI出现,围绕现有安全应对框架是否需要重估的讨论迅速升温。
本月7日,Anthropic通过“Project Glasswing”计划,以预览形式向12家大型科技公司和40余家重点企业开放Mythos预览版。据介绍,该模型找出了在以高安全性著称的OpenBSD中存在长达27年的漏洞,在漏洞发现和攻击利用方面的表现明显强于现有AI模型。
云安全联盟(CSA)近日发布的《Mythos Ready》报告显示,漏洞从披露到被利用的时间窗口,已从2018年的2.3年大幅缩短至2026年的20小时。CSA认为,在AI加速攻击的背景下,人工响应速度已难以跟上威胁演进。
报告指出,Mythos预览版能够自主发现主流操作系统和浏览器中的严重漏洞,并在无需人工介入的情况下生成可运行的攻击代码,其攻击速度和规模均已超出既有技术水平。
据称,Anthropic曾以Mozilla基金会的Firefox 147的JavaScript引擎为测试对象,对比Claude Opus 4.6与Mythos两款模型的漏洞利用能力。结果显示,Mythos成功181次,而Opus 4.6仅成功2次。
国家层面应对提速,治理体系亟待重塑
随着Mythos在漏洞发现和入侵利用方面的能力受到关注,韩国政府也开始推动应对工作。韩国科学技术信息通信部与韩国金融委员会已召开紧急会议,重点讨论与主要企业协同强化安全政策的方案。国家AI战略委员会也在研究,是否将“自主AI基础模型”项目提升至强化安全能力的层级。
多位专家认为,政府不能停留在风险提示层面,还应进一步强化统筹协调作用,推动漏洞信息共享和应对流程标准化。面对不同于以往的AI安全威胁,整体安全治理体系亟须重新设计。
Soonchunhyang University信息安全系名誉教授Yeom Heung-yeol表示,这一变化可能改写安全行业的游戏规则。过去,漏洞修补通常还留有数月时间窗口,但未来这一周期可能缩短至1天以内,因此必须重建更快速的补丁响应治理机制。
Yeom Heung-yeol进一步指出,关键在于尽可能提前完成彻底的安全修补,这需要国家层面建立起结构化、体系化的应对机制。
Dongguk University国际信息安全研究生院教授Hwang Seok-jin也强调,应对方式必须同步转变。他表示,随着新一代AI持续出现,逐案应对的方式已存在明显局限,更重要的是提前搭建国家层面的应对架构,包括最小权限控制、日志审计以及事故报告体系等。
“用AI对抗AI”成共识,自动化防御被提上日程
在技术应对层面,安全策略调整已被认为不可避免。相较于在既有体系上进行局部修补,业界普遍认为,更需要转向面向AI攻击的自动化防御体系。
Hwang Seok-jin表示,未来安全范式应从依赖人工检查,转向以自动化防御为核心,构建由AI驱动、覆盖检测、研判和响应的一体化自动化闭环。
与此同时,技术能力差距也被视为重要变量。如果高性能AI模型只向特定群体开放,安全能力失衡可能进一步加剧。Iroun & Company代表Yun Du-sik表示,如果缺乏安全约束的Mythos仅向少数群体开放,无法接入这一体系的国家或组织将处于不利位置。
Yun Du-sik还指出,现实中即便漏洞已经出现,许多政府部门或机构仍处于“无法及时打补丁”的状态,操作系统或软件更新滞后、资产管理薄弱,才是更基础也更突出的风险点。他强调,准确掌握并持续管理组织内部的IT资产和漏洞情况,是最基本的应对措施。
另一方面,Anthropic已于本月16日发布Opus 4.7,并下调了部分能力,以与Mythos形成区隔。Anthropic在博客中表示,Opus 4.7的网络安全能力被设计为低于Mythos预览版,训练过程中也同步进行了削弱相关能力的实验。
OpenAI也推出了面向安全漏洞检测优化的“GPT-5.4-Cyber”模型。与Anthropic的做法类似,GPT-5.4-Cyber同样优先向部分专家开放,并设置了相应的安全防护机制。
业界普遍将这一动向解读为,在高性能AI安全风险上升背景下,企业正有意放缓高风险能力的开放节奏。一位安全行业人士表示,Anthropic与OpenAI都清楚模型被滥用后可能产生的影响,两家公司或许正在权衡正式版本的开放范围。