Bộ Khoa học và Công nghệ Thông tin - Truyền thông Hàn Quốc ngày 31/3 cho biết hai mô hình nền tảng AI chuyên biệt cho y tế và sinh học do các nhóm trong nước phát triển đã vượt đợt đánh giá giữa kỳ, qua đó được tiếp tục triển khai giai đoạn 2.
Kết quả này được công bố trong khuôn khổ dự án phát triển “mô hình nền tảng AI chuyên biệt”, do bộ phối hợp với Viện Xúc tiến Công nghiệp Thông tin - Truyền thông Hàn Quốc (NIPA) và Hiệp hội Công nghệ Thông tin - Truyền thông Hàn Quốc (TTA) thực hiện.
Từ tháng 11 năm ngoái, liên danh Lunit và liên danh KAIST đã phát triển từ đầu các mô hình nền tảng AI chuyên biệt cho lĩnh vực y khoa và sinh học. Trong đợt đánh giá giữa kỳ, cả hai đều đạt trên 80 điểm, vượt ngưỡng 70 điểm để được hỗ trợ ở giai đoạn 2. Theo bộ, mỗi liên danh sẽ tiếp tục được cấp 256 GPU Nvidia B200 đến đầu tháng 9.
Mô hình nền tảng y khoa 16 tỷ tham số do liên danh Lunit phát triển sử dụng kiến trúc Mixture of Experts (MoE). Theo đánh giá, mô hình này cho kết quả tốt ở các hạng mục như độ chính xác trong tác vụ hỏi đáp dựa trên bài báo y khoa, mức độ đối chiếu nguồn và căn cứ, cùng năng lực viết và phân tích mã khoa học. Kết quả được so sánh với các mô hình đa dụng cỡ lớn từ 100 tỷ đến 1 nghìn tỷ tham số, trong đó có Claude 3.5 Sonnet của Anthropic.
Trên nền tảng đó, liên danh Lunit cũng xây dựng hệ thống tác nhân hỗ trợ ra quyết định lâm sàng (CDSS). Khi áp dụng trên dữ liệu y tế thực tế tại Bệnh viện Ilsan thuộc Cơ quan Bảo hiểm Y tế Quốc gia trong giai đoạn tháng 2-3, hệ thống này ghi nhận độ chính xác cao trong phân loại bệnh nhân cấp cứu theo 5 mức và đạt tỷ lệ trùng khớp chẩn đoán 94,0%.
Trong khi đó, mô hình nền tảng sinh học 2 tỷ tham số mang tên K-Fold của liên danh KAIST được đánh giá có độ chính xác dự đoán cấu trúc 3D của phức hợp protein ở mức xấp xỉ AlphaFold3 của Google, nhưng tốc độ dự đoán nhanh hơn tới hơn 30 lần. Thời gian dự đoán cấu trúc được rút từ khoảng 30 phút của AlphaFold3 xuống còn dưới 1 phút mỗi lần.
KAIST cho biết nhóm đã áp dụng một cách tiếp cận mới dựa trên tương tác lý - hóa, thay cho phương pháp hiện có, nhằm nâng độ chính xác ngay cả với các phức hợp thuốc mới có dữ liệu hạn chế.
Hai mô hình của hai liên danh sẽ được công bố dưới dạng mã nguồn mở trên Hugging Face vào đầu tháng 4 theo giấy phép Apache 2.0. Ở giai đoạn 2, liên danh Lunit dự kiến mở rộng mô hình lên tối đa 32 tỷ tham số và triển khai kiểm chứng thực địa trong tháng 7-8 tại 9 bệnh viện, cùng SK Biopharm và các đơn vị liên quan.
Về phía KAIST, liên danh này sẽ mở rộng mô hình lên 7 tỷ tham số và tích hợp vào dịch vụ đám mây phát triển thuốc mới bằng AI của tập đoàn dược phẩm toàn cầu Merck, qua đó thúc đẩy quá trình mở rộng ra thị trường quốc tế.
Ông Choi Dong-won, Vụ trưởng Vụ Chính sách Hạ tầng AI thuộc bộ, cho biết chỉ trong khoảng 5 tháng, Hàn Quốc đã xây dựng được nền tảng công nghệ đủ sức cạnh tranh trên thị trường toàn cầu. Ông nhấn mạnh bộ sẽ tiếp tục hỗ trợ về chính sách để đẩy nhanh thương mại hóa tiềm năng ứng dụng của AI trong các lĩnh vực giá trị gia tăng cao như chẩn đoán, điều trị và phát triển thuốc mới.