Cloudflare cho biết sau khi thử nghiệm mô hình AI bảo mật Mithos Preview của Anthropic trên các kho mã nguồn nội bộ, khả năng phát hiện lỗ hổng và tạo mã PoC đã được cải thiện rõ rệt. Công ty đồng thời cảnh báo trong kỷ nguyên AI, khoảng thời gian từ lúc lỗ hổng được phát hiện đến khi bị khai thác thực tế đang rút ngắn mạnh, thậm chí chỉ còn vài phút.
Theo ITmedia, ngày 19/5 (giờ địa phương), Cloudflare gần đây đã triển khai thử nghiệm Mithos Preview trên hơn 50 kho mã nguồn nội bộ. Hoạt động này nằm trong khuôn khổ Project Glasswing, dự án phòng thủ an ninh mạng ứng dụng AI.
Project Glasswing có sự tham gia của Anthropic, Amazon Web Services, Google, Microsoft và CrowdStrike. Dự án hướng tới bảo vệ và tăng cường độ an toàn cho các hạ tầng phần mềm quan trọng bằng AI.
Mithos Preview là mô hình AI chuyên về bảo mật do Anthropic phát triển. Ngoài khả năng phân tích mã nguồn, mô hình này còn có thể tìm lỗ hổng phần mềm và tạo mã PoC nhằm kiểm chứng khả năng khai thác trong thực tế.
Theo đánh giá của Cloudflare, Mithos Preview cho thấy năng lực vượt một bước so với các mô hình AI đa dụng hiện nay. Điểm nổi bật của mô hình là khả năng tạo exploit chain bằng cách liên kết nhiều lỗ hổng nhỏ thành một đường tấn công hoàn chỉnh, đồng thời tự tạo và thực thi mã kiểm chứng khai thác.
Cloudflare cũng cho biết việc AI đưa ra kèm mã PoC giúp giảm đáng kể số lượng cảnh báo giả, vốn là hạn chế thường gặp ở các công cụ quét lỗ hổng ứng dụng AI trước đây. Nhờ đó, khối lượng công việc sàng lọc và xác minh lỗ hổng thủ công cũng được cắt giảm.
Tuy nhiên, công ty cho biết quá trình thử nghiệm vẫn bộc lộ một số giới hạn. Ngay trong quy trình nghiên cứu bảo mật thông thường, các guardrail của mô hình đôi khi vẫn được kích hoạt và từ chối thực hiện tác vụ. Điều này cho thấy ngay cả trong các kịch bản phòng thủ, hoạt động nghiên cứu vẫn có thể bị ràng buộc do đặc thù phải kiểm chứng khả năng khai thác thực tế.
Cloudflare cũng nhận định rằng ngay cả với một mô hình AI mạnh, việc triển khai trực tiếp một agent lập trình đa năng trên toàn bộ codebase vẫn khó tạo ra hiệu quả đủ lớn. Để khắc phục giới hạn về ngữ cảnh xử lý và hiệu năng, cần chia nhỏ tác vụ và vận hành song song nhiều agent chuyên biệt trong một pipeline thực thi riêng.
Bên cạnh đó, Cloudflare cảnh báo môi trường an ninh mạng đang thay đổi nhanh trong thời đại AI. Trước đây, khoảng thời gian từ khi phát hiện lỗ hổng đến khi xuất hiện tấn công thực tế thường kéo dài vài tháng. Hiện nay, AI có thể rút ngắn khoảng thời gian này từ vài tháng xuống chỉ còn vài phút.
Theo đó, các tổ chức bảo mật không thể chỉ dừng ở việc tăng tốc vá lỗi, mà cần thiết kế lại kiến trúc ứng dụng và các lớp phòng thủ để ngăn kẻ tấn công tiếp cận lỗ hổng.
Giới chuyên môn đánh giá trường hợp của Cloudflare cho thấy rõ tính hai mặt của cuộc đua an ninh mạng dựa trên AI. AI vừa giúp nâng độ chính xác trong phát hiện lỗ hổng và cải thiện hiệu quả phòng thủ, vừa đẩy nhanh tự động hóa tấn công và tốc độ khai thác. Vì vậy, bài toán quan trọng với doanh nghiệp không chỉ nằm ở việc sử dụng công cụ AI bảo mật, mà còn ở cách tích hợp chúng vào quy trình vận hành và kiến trúc phòng thủ phù hợp.