搜索关键词 多轮对话
AI & Enterprise
Meta布局个人AI代理“Hatch”,并加快推进Instagram购物代理
据报道,Meta正研发面向个人用户的AI代理“Hatch”,同时推进与Instagram联动的购物代理产品。Hatch受开源AI代理工具OpenClaw启发,计划于6月底前完成内部测试,并将在仿照DoorDash、Etsy、Reddit等网站的虚拟环境中验证安全性,同时增强自主决策、信息处理和记忆能力。
AI & Enterprise
研究称:让大模型扮演“专家”未必更准,编程和数学任务表现反而下滑
南加州大学(USC)研究团队对6款AI模型测试“专家角色”提示词后发现,“你是某领域专家”等设定并不会稳定提升回答质量,反而可能拖累编程、数学及部分知识类任务表现。研究认为,模型可能将计算资源用于遵循角色设定,而非调用事实信息;不过在JailbreakBench测试中,这类提示词对拦截不当内容的表现有所改善。
AI & Enterprise
Nature:多轮对话可能削弱AI拒绝机制,ChatGPT、Claude、Grok等在学术不端请求前更易松动
《Nature》报道称,AFIM基准对ChatGPT、Claude、Grok等13款模型进行了多轮对话测试。结果显示,面对学术不端类请求,模型在持续追问下可能从最初拒绝转向部分回应。其中,Claude的拒答能力相对更强,Grok和早期GPT模型则更容易在长对话中失守。研究也再次引发业界对将多轮对话上下文纳入AI安全设计的讨论。