据外媒当地时间18日报道,加拿大安大略省审计长办公室在检查省政府相关AI项目后指出,面向医疗机构推广的AI病历记录工具存在反复出现的严重错误。
此次审计对象为安大略省已批准在临床场景使用的20款AI Scribe系统。该类系统可在诊疗过程中录制医患对话,并自动生成就诊记录,原本被视为帮助医生减轻文书录入负担的工具。
审计采用模拟问诊录音进行测试,并将系统输出与实际内容逐项比对。结果显示,20款系统中有12款将药物名称记错;另有9款生成了录音中并不存在的治疗计划;还有17款遗漏了与患者精神健康相关的重要信息。
报告指出,一旦药名、症状或治疗方向等基础信息出现偏差,问题就不再只是文书层面的疏漏,而可能直接影响临床判断和实际诊疗。
除系统表现本身外,审计还将问题指向评审机制。报告显示,在安大略省对AI医疗记录系统的评分标准中,厂商是否在省内设有据点占总分30%;而就诊记录准确性仅占4%,偏见缓解占2%,威胁、风险和隐私评估也分别只占2%。报告认为,这种“不恰当的权重设置”可能导致病历生成不准确、或无法充分保护敏感健康信息的AI工具进入医疗机构。
在实际使用环节,相关安全保障同样被指不到位。为安大略省医疗系统提供IT支持的OntarioMD此前一直建议,医生应对AI生成的记录进行人工复核。但审计指出,获批系统并未普遍内置医生最终确认的强制功能,这意味着错误记录仍有可能被直接采用。
需要说明的是,此次审计基于模拟问诊录音场景,对已获批AI系统进行了验证,并非真实诊疗环境下的全面复盘。尽管如此,报告仍反映出,医疗AI即便在基础诊疗信息记录上也可能出现明显偏差,而引入前评审与引入后验证两道环节,均未能有效拦截相关问题。
安大略省卫生部门发言人表示,参与AI Scribe项目的医生已超过5000名,目前尚未确认与该技术直接相关的患者伤害报告。
此次审计也再次引发外界对医疗AI落地路径的关注。报告所暴露的问题表明,相比单纯追求上线速度,医疗AI更需要优先补齐验证体系与使用过程中的安全机制。尤其是在药名、治疗计划、精神健康信息等直接关系诊疗判断的内容上,一旦出现误记,便可能演变为患者安全风险。
从这一案例来看,医疗AI系统除了在上线前完成准确性、偏见与隐私保护评估外,在实际应用中也仍需设置医生最终确认等必要机制。随着AI在医疗场景加快渗透,如何在自动化带来的效率提升与临床责任之间取得平衡,正成为愈发突出的议题。