搜索关键词 测试评估
Industry
Samsung Electronics将向DX部门员工引入外部生成式AI服务,计划6月正式上线
Samsung Electronics表示,将面向DX部门员工引入外部生成式AI服务,计划于6月正式上线。公司已在4月至5月期间面向2500名员工开展PoC测试,对Gemini、ChatGPT和Claude进行评估,并将根据员工偏好调查结果确定最终方案。相关服务仅向完成安全培训的员工开放,同时维持自研“Samsung Gauss”与外部AI工具并行的双轨模式。
Crypto
CoinQuant升级AI交易平台架构,覆盖交易员与自主AI代理
AI无代码交易平台CoinQuant宣布将平台升级为统一交易智能架构,面向人类交易员和自主AI代理提供支持。新架构整合机构级回测、结构化市场数据、AI优化能力和领域专家系统,并正准备在Hyperliquid上线自动策略执行层。与此同时,公司正推进300万美元种子轮融资。
AI & Enterprise
研究称:让大模型扮演“专家”未必更准,编程和数学任务表现反而下滑
南加州大学(USC)研究团队对6款AI模型测试“专家角色”提示词后发现,“你是某领域专家”等设定并不会稳定提升回答质量,反而可能拖累编程、数学及部分知识类任务表现。研究认为,模型可能将计算资源用于遵循角色设定,而非调用事实信息;不过在JailbreakBench测试中,这类提示词对拦截不当内容的表现有所改善。