OpenAI的GPT-5.5。图片来源:OpenAI

英国AI安全研究所(AISI)最新评估显示,OpenAI旗下GPT-5.5在受控研究环境中表现出高级网络攻击能力。

据CoinPost当地时间2日报道,隶属英国科学、创新与技术部(DSIT)的AISI于4月30日发布报告,对GPT-5.5在网络攻击任务中的表现发出警示。

报告显示,AISI主要从两类场景对GPT-5.5进行了评估。第一类为CTF测试,重点考察模型在漏洞挖掘和攻击利用方面的能力。在最高难度任务组中,GPT-5.5的平均成功率为71.4%,高于Mythos的68.6%。其中,在逆向工程任务中,GPT-5.5耗时10分22秒完成挑战。AISI称,相同任务若由人类安全专家执行,可能需要约12小时。

第二类评估在模拟真实网络环境及防御体系的网络靶场中进行。在名为“The Last Ones”的32步场景中,GPT-5.5在10次尝试中有2次自主完成全链路攻破。该场景模拟企业渗透流程,专家手动完成通常需要约20小时。相比之下,在面向工业控制系统的“Cooling Tower”场景中,尚无任何AI模型实现突破。

AISI表示,近期多家AI开发商陆续推出具备高级攻击能力的模型。如果模型的逻辑推理和自主执行能力继续提升,短期内可能会有更多模型出现类似的能力跃升。

不过,AISI也强调,上述结果来自受控研究环境,不能直接等同于公开版GPT-5.5的实际表现。报告指出,公开版本已部署安全防护,但在约6小时的红队测试中,研究人员仍发现了可绕过防护的方式,并在全部预设恶意提示词中均诱导出高风险输出。此后,OpenAI已进行补丁修复,但由于测试环境配置问题,最终安全性验证尚未完成。

英国方面数据显示,过去一年,43%的企业因网络攻击蒙受损失。为应对新型威胁,英国政府已追加投入9000万英镑,以加强网络防御能力建设。

关键词

#OpenAI #GPT-5.5 #英国AI安全研究所 #网络安全 #CTF #网络靶场 #红队测试 #安全防护 #绕过防护
版权所有 © DigitalToday。未经授权禁止转载或传播。