Mô hình AI chuyên về an ninh mạng Mythos của Anthropic được cho là đã phát hiện các lỗ hổng trong hệ thống tuyệt mật của Chính phủ Mỹ chỉ sau vài giờ. Dù đây chỉ là một cuộc thử nghiệm có kiểm soát, kết quả vẫn cho thấy AI có thể nhanh chóng nhận diện điểm yếu ngay cả trong những hệ thống được bảo vệ ở cấp độ an ninh quốc gia.
Theo TechRadar ngày 24/6, tại một phiên điều trần gần đây trước Quốc hội Mỹ, Thượng nghị sĩ bang Virginia Mark Warner cho biết ông đã nhận được báo cáo từ Joshua Rudd, người đứng đầu Cơ quan An ninh Quốc gia Mỹ (NSA). Theo đó, Mythos “gần như đã xâm nhập được hầu hết các hệ thống mật chỉ trong vài giờ, thay vì vài tuần”.
Tuy nhiên, đây không phải một vụ tấn công thực tế. Cuộc thử nghiệm được Anthropic phối hợp với các cơ quan tình báo Mỹ triển khai trong môi trường kiểm soát. Một quan chức Chính phủ Mỹ giấu tên cho biết Mythos không chiếm quyền hệ thống, mà chỉ xác định các lỗ hổng bảo mật trong thời gian rất ngắn. Nói cách khác, mô hình này đã tìm ra những điểm yếu có thể bị khai thác để tấn công vào các hệ thống chính phủ được bảo vệ nghiêm ngặt.
Mythos là mô hình AI chuyên về bảo mật được Anthropic giới thiệu từ tháng 4 năm nay. Công ty cho rằng năng lực tìm lỗ hổng bảo mật của mô hình quá mạnh, đồng thời cũng có nguy cơ bị lạm dụng cho mục đích tấn công, nên chưa phát hành rộng rãi. Thay vào đó, Anthropic chỉ cung cấp giới hạn cho một số doanh nghiệp và tổ chức lớn nhằm hỗ trợ phát hiện lỗ hổng trước khi tin tặc khai thác.
Một số đơn vị triển khai sớm đã đưa ra đánh giá tích cực về hiệu quả của công cụ này. Mozilla cho biết Mythos đạt trình độ tương đương các nhà nghiên cứu bảo mật hàng đầu thế giới. Trong tháng 4, Mozilla đã sử dụng công cụ này để khắc phục hơn 400 lỗ hổng bảo mật được phát hiện trên Firefox.
Dữ liệu vận hành do Anthropic công bố cũng phản ánh xu hướng tương tự. Theo công ty, 50 doanh nghiệp sử dụng Mythos trong khoảng hai tháng đã phát hiện hơn 10.000 lỗ hổng ở mức nghiêm trọng hoặc rủi ro cao. Nhiều doanh nghiệp cũng cho biết tốc độ phát hiện lỗ hổng nhanh hơn 10 lần so với trước đây.
Anthropic cũng nêu trường hợp của Cloudflare. Theo công ty, Cloudflare đã dùng Mythos để phát hiện 2.000 lỗi trong các hệ thống lõi, trong đó 400 lỗi được xếp vào nhóm rủi ro cao hoặc nghiêm trọng. Đội ngũ bảo mật của Cloudflare cũng đánh giá tỷ lệ cảnh báo sai của công cụ này thấp hơn so với các nhà nghiên cứu bảo mật con người.
Diễn biến trên cho thấy AI tạo sinh có thể được sử dụng cho cả tấn công lẫn phòng thủ trong lĩnh vực an ninh mạng. Hiện Anthropic vẫn chưa mở rộng phát hành Mythos và chỉ cung cấp mô hình này cho một nhóm khách hàng hạn chế. Dù vậy, việc kết quả thử nghiệm trên hệ thống tuyệt mật của Chính phủ Mỹ được hé lộ đang làm dấy lên sự quan tâm đối với phạm vi ứng dụng cũng như cách kiểm soát các mô hình AI an ninh mạng.
Giới chuyên môn dự báo Anthropic nhiều khả năng sẽ tiếp tục duy trì chính sách phân phối hạn chế đối với Mythos, đồng thời mở rộng các trường hợp sử dụng trong rà soát lỗ hổng và củng cố hệ thống phòng thủ tại doanh nghiệp cũng như cơ quan nhà nước.