Palo Alto Networks cho biết đã phát hiện 75 lỗ hổng bảo mật chỉ sau một tháng triển khai các mô hình AI chuyên cho an ninh mạng của Anthropic và OpenAI. Theo Axios ngày 13/5 (giờ địa phương), con số này cao gấp hơn 7 lần mức trung bình 5-10 lỗ hổng bảo mật mỗi tháng mà công ty thường ghi nhận trước đó.
Palo Alto Networks là một trong số ít doanh nghiệp được tiếp cận sớm đồng thời hai mô hình gồm Mythos của Anthropic và GPT-5.5-Cyber của OpenAI.
Trong vòng một tháng, công ty đã quét hơn 130 sản phẩm. Palo Alto Networks cho biết toàn bộ 75 lỗ hổng được phát hiện đều đã được vá, đồng thời chưa ghi nhận trường hợp nào bị khai thác trong các cuộc tấn công thực tế.
Lee Klarich, Giám đốc Sản phẩm của Palo Alto Networks, cho biết thế mạnh nổi bật của hai mô hình này là khả năng kết nối nhiều điểm yếu riêng lẻ để hình thành một kịch bản tấn công khả thi. Theo ông, nhiều lỗi nếu xét riêng thì chưa đến ngưỡng phải công bố, nhưng khi kết hợp lại có thể trở thành lỗ hổng rủi ro cao. Trong các thử nghiệm nội bộ, các mô hình này tạo ra mã khai thác với tỷ lệ thành công trên 70%, đồng thời cho chất lượng tốt hơn đáng kể so với trước đây.
Dù vậy, Palo Alto Networks cho rằng việc phát hiện lỗ hổng bằng AI vẫn đòi hỏi chuyên môn của con người và mức độ tùy biến cao. Axios cho biết tỷ lệ cảnh báo sai trung bình vào khoảng 30%, và kết quả có thể chênh lệch đáng kể tùy theo cách các nhà nghiên cứu tinh chỉnh mô hình cũng như ngữ cảnh được cung cấp.
Klarich nhấn mạnh các mô hình này không phải là “phép màu”. Ông cho biết công ty đã đầu tư đáng kể để xây dựng một bộ khung quét AI nhằm kết nối các mô hình với những mục tiêu cần rà soát.