| 移动网页

斯坦福团队发现医疗视觉AI评测漏洞:无影像输入仍会生成诊断

斯坦福大学研究团队发现,多款医疗视觉AI在未接收病理图像、胸部X光片或脑部MRI等影像输入时,仍会描述并不存在的影像内容,并据此给出诊断。研究将这一现象称为“mirage reasoning”,并指出相关模型在传统评测基准中仍可能获得高分。为此,团队提出B-Clean方法,筛除仅凭题干即可推断答案的题目,仅保留必须依赖真实影像作答的题目。