英国AI安全研究所(AISI)最新公布的评测结果显示,Anthropic旗下“Claude Mythos Preview”在专家级网络安全测试中取得73%的成功率,并成为首个完成企业网络攻击模拟全流程的AI模型。
据BeInCrypto4月14日报道,这项评测发布于Anthropic本月7日推出Claude Mythos Preview之后。该模型目前尚未向公众开放,仅限部分安全研究公司小范围使用。Anthropic表示,Claude Mythos Preview在计算机安全任务中表现突出,并已启动“Project Glasswing”,目标是提升关键软件安全性,同时为行业提前建立应对机制。
从测试内容看,评测共分为两个阶段。第一阶段为“夺旗”(CTF)测试,要求模型自主发现漏洞并获取隐藏标识。AISI称,Claude Mythos Preview在专家级任务中的成功率达到73%。AISI同时指出,截至2025年4月,此前尚无任何模型通过这一级别测试。
第二阶段为被称作TLO的32步企业网络攻击模拟。AISI介绍,这项任务若由人类安全专家执行,通常需要约20小时。测试结果显示,Claude Mythos Preview在10次测试中有3次完成全部32个步骤,平均完成22步;作为对比,Claude Opus 4.6平均完成16步。
不过,研究团队也强调,不宜将测试结果直接等同于现实中的威胁水平。研究人员指出,这类靶场测试的前提是已获得网络访问权限,因此其结果更多说明模型已具备对防御较弱的小型企业系统发起自主攻击的初步能力。与此同时,测试环境本身被设计得比真实世界更容易遭到攻击,二者仍存在明显差异。
Anthropic还披露了内部安全测试结论:在用户给出明确指令的情况下,Claude Mythos Preview能够在主流操作系统和代表性浏览器环境中发现并利用零日漏洞。公司表示,在已识别的漏洞中,目前99%以上仍未修复,因此公开相关细节并不负责任。
尽管该模型仍处于限量开放阶段,但其能力已引发技术界和政策层面的广泛关注。路透社援引多名消息人士称,美国财政部长Scott Bessent与美联储主席Jerome Powell曾召集多家大型银行首席执行官举行紧急会议,并就与该模型相关的潜在风险发出警告。
AISI还向企业给出优先应对建议,包括定期修补漏洞、严格实施访问控制、强化安全配置以及完善日志记录等基础措施。AI模型的攻击能力将以多快速度影响真实场景,企业又能否在模型仍处于限制性开放阶段时及时补强防线,已成为接下来市场关注的重点。