搜索关键词 护栏
AI & Enterprise
Rubrik推出Agent Cloud,为Anthropic Claude Code和Claude Cowork强化代理安全
数据安全公司Rubrik正式推出面向Anthropic Claude Code和Claude Cowork的安全平台Agent Cloud,聚焦AI代理治理、风险可视化、操作回滚及代码库保护。与此同时,Rubrik还宣布通过Project Hourglass与6家全球系统集成商达成合作。该公司援引一项调查称,多数安全负责人担心AI代理将在未来一年突破安全护栏,并加大恢复时间目标实现难度。
AI & Enterprise
Anthropic发布Claude Fable 5,收紧网络安全及生物化学相关提问限制
Anthropic正式推出对外公开的Claude Fable 5,并同步加强对网络安全、生物和化学相关提问的安全限制。公开版在识别到敏感主题提问时将自动切换至Claude Opus 4.8;具备更高风险能力的Mythos 5则仅通过既有项目向经审核的可信网络防御人员开放。公司同时披露了API和企业版定价与访问政策。
AI & Enterprise
安全研究员称可诱导 ChatGPT 弱化护栏并生成恶意代码
荷兰安全研究员 Kevin Zwaan 表示,他通过持续对话操控 ChatGPT 的情绪取向,诱导模型逐步弱化护栏机制并最终生成恶意代码,并将这一方法命名为 AMAI。他称,这类攻击难以被现有 AI 安全防护方案识别,首次尝试耗时约1小时30分钟,后续可缩短至几分钟。
-
AI & Enterprise
Snowflake在Summit 26发布多项安全新功能,聚焦Agentic AI零信任安全
-
AI & Enterprise
Snowflake收购Natoma,加码AI代理安全接入能力
-
AI & Enterprise
实测显示:借助GitHub工具数分钟内可移除Meta、Google开放权重模型安全护栏
-
AI & Enterprise
Ontology成AI底层能力焦点:以显式知识补足LLM短板
-
Crypto
Sooho.io携手Kite打造AI Agent支付基础设施 推进韩国市场落地
-
AI & Enterprise
Cloudflare测试Anthropic安全模型Mithos Preview:漏洞利用链构造能力增强,利用周期从数月压缩至数分钟
-
Games & Commerce
Kakao升级“AI国民秘书”:支持语音办理电子证明开具和公共设施预约
-
AI & Enterprise
Cisco开源Foundry Security Spec,规范基于LLM的安全评估
-
Crypto
美国参议院银行委员会公布《CLARITY》修正案:限制稳定币收益,明确DeFi非托管开发者保护
-
AI & Enterprise
韩国拟于5月底发布AI网络安全综合应对方案,Opus 4.7在企业渗透测试中成功验证
-
AI & Enterprise
KISA启动实施2026年信息保护新技术支持项目,18个课题、50家入选企业已确定
-
Finance
Jamie Dimon警示Anthropic“Claude Mythos”网络安全风险,呼吁金融业提前应对
-
AI & Enterprise
Google向美国国防部开放商用AI模型,适用于“所有合法政府用途”
-
AI & Enterprise
Demis Hassabis:AI有望在未来10至20年推动疾病、环境和能源领域突破
-
AI & Enterprise
PocketOS创始人:AI编码代理9秒清空生产数据