搜索关键词 模型评估
AI & Enterprise
SK Telecom将参加MWC26“全球AI红队挑战” 检验A.X K1安全性与可信性
SK Telecom宣布,将在MWC26期间参加“全球AI红队挑战”,对自研大模型A.X K1的安全性与可信性进行检验。该活动由GSMA与Selectstar联合主办,将于当地时间3月3日在巴塞罗那MWC会场的Talent Arena举行,约100名评测人员将重点测试异常应答、信息泄露等潜在滥用风险。
AI & Enterprise
Cloudera:合成数据可帮助企业降低LLM隐私风险
Cloudera表示,随着大语言模型(LLM)和AI代理加快进入企业业务,训练、测试和评估所用数据越来越多地涉及个人可识别信息(PII)、受监管数据及企业专有业务内容,隐私与合规风险随之上升。该公司认为,合成数据能够在不暴露真实记录的情况下支持AI开发与测试,并将SFT、模型评估以及RAG与AI代理相关数据治理列为三大重点应用方向。
AI & Enterprise
韩国政府:本土AI基础模型评估将按社会普遍认可标准推进,结果详细公开
韩国副总理兼科学技术信息通信部长官 Bae Kyung-hoon 表示,政府正按照社会普遍认可的标准推进本土AI基础模型评估,并将在技术、政策、伦理等维度向公众详细公开结果。目前共有Naver Cloud、Upstage、SK Telecom、NC AI、LG AI Research等5个联合体参与项目,首轮评估结果即将公布。韩国政府称,将在资源有限的情况下集中力量冲击全球领先水平,同时继续为未入选企业提供支持。