搜索关键词 安全护栏
AI & Enterprise
实测显示:借助GitHub工具数分钟内可移除Meta、Google开放权重模型安全护栏
测试显示,Meta的Llama 3.3和Google的Gemma 4等开放权重模型,可借助GitHub上公开的工具在短时间内移除安全护栏。安全机制被去除后,模型会回应原本应拒绝的高风险提问。业内担忧,这类去除限制后的衍生模型正在快速扩散,相关监管与治理讨论可能随之升温。
Crypto
Sooho.io携手Kite打造AI Agent支付基础设施 推进韩国市场落地
数字资产基础设施公司Sooho.io宣布与Kite达成合作,双方将围绕AI Agent支付基础设施建设展开协作,并推动相关服务在韩国市场落地。根据合作规划,双方将对接Kite Agent Passport与Ezys,挖掘韩国本地应用场景,同时联合拓展全球商户及支付服务商合作。
AI & Enterprise
Cloudflare测试Anthropic安全模型Mithos Preview:漏洞利用链构造能力增强,利用周期从数月压缩至数分钟
Cloudflare在逾50个内部代码仓库中测试Anthropic安全模型Mithos Preview后表示,该模型在漏洞检测、PoC生成和漏洞利用链构造等方面较通用模型表现更强,同时减少了误报和人工验证负担。不过,安全护栏偶尔会拦截任务,通用编程代理直接接入代码库的效果也有限,仍需配合专用代理和执行流程。Cloudflare还警告称,借助AI,从发现漏洞到实施利用的周期正从数月缩短至数分钟。
-
Games & Commerce
Kakao升级“AI国民秘书”:支持语音办理电子证明开具和公共设施预约
-
AI & Enterprise
Cisco开源Foundry Security Spec,规范基于LLM的安全评估
-
Crypto
美国参议院银行委员会公布《CLARITY》修正案:限制稳定币收益,明确DeFi非托管开发者保护
-
AI & Enterprise
韩国拟于5月底发布AI网络安全综合应对方案,Opus 4.7在企业渗透测试中成功验证
-
Finance
Jamie Dimon警示Anthropic“Claude Mythos”网络安全风险,呼吁金融业提前应对
-
AI & Enterprise
Google向美国国防部开放商用AI模型,适用于“所有合法政府用途”
-
AI & Enterprise
Demis Hassabis:AI有望在未来10至20年推动疾病、环境和能源领域突破
-
AI & Enterprise
研究称ChatGPT在反复输入争吵对话后或升级攻击性表达,甚至出现威胁性措辞
-
AI & Enterprise
S2W:AI安全策略应从“拦截”转向持续漏洞治理
-
AI & Enterprise
AIM Intelligence获100亿韩元A轮融资,加快全球市场拓展
-
AI & Enterprise
HBR警示:AI智能体或具恶意软件式风险,需尽快建立管控机制
-
AI & Enterprise
Cloocus发布企业级AI平台ClooSphere,瞄准AI持续运营管理
-
AI & Enterprise
Claude登顶苹果App Store,超越ChatGPT
-
AI & Enterprise
OpenAI公开与美国防部合作细节:已设多重AI安全护栏
-
AI & Enterprise
Anthropic旗下Claude陷入五角大楼风波后升至App Store第二