搜索关键词 结果验证
AI & Enterprise
SK Telecom论文亮相ICLR 2026:AI推荐模型可更精准识别用户真实偏好
SK Telecom在ICLR 2026公开AI推荐模型研究成果,提出自研C-APO“冲突偏好优化”技术,通过识别并削弱用户行为数据中的冲突偏好,区分长期一致偏好与短期表面偏好,以提升推荐准确性和可解释性。公司计划后续将该技术应用于Agent推荐系统。
AI & Enterprise
OpenAI推出生物学研究大模型GPT-Rosalind
OpenAI发布面向生物学研究的大语言模型GPT-Rosalind,称其已学习生物学研究中常见的50种工作流程,并可访问主要公共生物数据库,用于识别潜在生物通路并对药物靶点进行优先级排序。OpenAI表示已着手降低模型迎合用户、给出过度乐观答案的倾向,但幻觉问题改善程度仍有待验证。出于滥用风险考虑,该模型目前仅向总部位于美国的机构开放有限申请。
AI & Enterprise
KAIST与Microsoft Research研发大语言模型时间推理自动评测诊断系统
KAIST表示,该校电气与电子工程系教授Eui-jong Hwang团队与Microsoft Research联合研发出一套面向大语言模型时间推理能力的自动评测系统。该系统基于时态数据库(Temporal Database)设计理论,可自动完成题目生成、答案推导和结果验证,并覆盖13类时间推理题目。团队同时引入新的评测指标,用于检验回答中的日期和时间跨度是否符合逻辑,使“时间幻觉”(Temporal Hallucination)识别率平均提升21.7%,人工输入数据量平均减少51%。