Tỉnh Ontario của Canada đã phê duyệt 20 hệ thống AI Scribe để sử dụng tại các cơ sở y tế, nhưng kiểm toán cho thấy 12 hệ thống trong số này ghi sai tên thuốc khi xử lý các bản ghi mô phỏng.
Theo Gigazine, ngày 18/5, Văn phòng Tổng kiểm toán Ontario công bố kết quả rà soát và cho biết nhiều công cụ AI dùng để tự động tạo ghi chú khám bệnh đã lặp lại các lỗi nghiêm trọng.
Các hệ thống bị nêu trong báo cáo thuộc nhóm AI Scribe, có chức năng ghi âm cuộc trao đổi giữa bác sĩ và bệnh nhân trong quá trình thăm khám, sau đó tự động tạo ghi chú khám. Nhóm kiểm toán đã đưa các bản ghi mô phỏng vào 20 hệ thống đã được phê duyệt và đối chiếu kết quả đầu ra.
Kết quả cho thấy 12 hệ thống ghi tên thuốc khác với nội dung trong bản ghi mô phỏng. Có 9 hệ thống còn tự tạo cả kế hoạch điều trị dù nội dung này không xuất hiện trong bản ghi.
Ngoài ra, 17 hệ thống bỏ sót các thông tin quan trọng liên quan đến sức khỏe tâm thần của bệnh nhân. Báo cáo lưu ý việc tự động hóa ghi chú được triển khai nhằm giảm gánh nặng hành chính cho nhân viên y tế, nhưng sai sót ở tên thuốc hay kế hoạch điều trị có thể ảnh hưởng trực tiếp đến quá trình khám chữa bệnh.
Báo cáo kiểm toán cũng đặt vấn đề về cách chấm điểm trong quá trình thẩm định. Cụ thể, trong đợt đánh giá các hệ thống AI hỗ trợ hồ sơ y tế tại Ontario, tiêu chí doanh nghiệp có cơ sở đặt tại tỉnh chiếm tới 30% tổng điểm.
Trong khi đó, độ chính xác của ghi chú khám chỉ chiếm 4%. Khả năng xử lý thiên lệch chiếm 2%, còn các tiêu chí về mối đe dọa, rủi ro và quyền riêng tư cũng chỉ chiếm 2% cho mỗi hạng mục. Báo cáo cảnh báo cơ cấu trọng số “không phù hợp” này có thể khiến những công cụ AI tạo hồ sơ thiếu chính xác hoặc chưa bảo vệ đầy đủ dữ liệu sức khỏe nhạy cảm vẫn được lựa chọn.
Các biện pháp an toàn trong quá trình vận hành cũng bị đánh giá là chưa đầy đủ. OntarioMD, tổ chức hỗ trợ công nghệ thông tin y tế của tỉnh, vẫn khuyến nghị bác sĩ phải kiểm tra thủ công các ghi chú do AI tạo ra.
Tuy nhiên, các hệ thống đã được phê duyệt lại không bắt buộc bác sĩ xác nhận cuối cùng trước khi sử dụng, làm tăng nguy cơ các ghi chú sai vẫn được đưa vào thực tế khám chữa bệnh.
Cuộc kiểm toán lần này chỉ kiểm chứng các hệ thống AI đã được phê duyệt bằng các bản ghi mô phỏng. Dù vậy, báo cáo cho thấy AI y tế vẫn có thể mắc lỗi ngay ở những thông tin khám bệnh cơ bản, trong khi quy trình thẩm định trước triển khai và cơ chế kiểm chứng sau triển khai đều chưa đủ chặt chẽ để sàng lọc rủi ro.
Người phát ngôn Bộ Y tế Ontario cho biết hiện có hơn 5.000 bác sĩ tham gia chương trình AI Scribe, và đến nay chưa ghi nhận trường hợp bệnh nhân bị tổn hại liên quan đến công nghệ này.
Kết quả kiểm toán cho thấy với AI y tế, hệ thống kiểm chứng cần được ưu tiên hơn tốc độ triển khai. AI Scribe có thể giúp giảm tải công việc hành chính, nhưng nếu ghi sai tên thuốc, tự tạo kế hoạch điều trị hoặc bỏ sót thông tin sức khỏe tâm thần, rủi ro đối với an toàn bệnh nhân sẽ tăng lên rõ rệt.
Báo cáo cho rằng các hệ thống AI trong y tế cần được đánh giá kỹ về độ chính xác, thiên lệch và bảo vệ quyền riêng tư trước khi triển khai, đồng thời phải bổ sung cơ chế an toàn buộc bác sĩ xác nhận cuối cùng trong quá trình sử dụng. Trường hợp của Ontario cho thấy khi AI được ứng dụng rộng hơn trong y tế, bài toán cân bằng giữa tiện ích tự động hóa và trách nhiệm lâm sàng ngày càng trở nên quan trọng.