Anthropic đã giới thiệu cho một số doanh nghiệp mô hình AI mới đang được phát triển nội bộ mang tên Claude Mythos, đồng thời công bố dự án an ninh mạng Glasswing với sự tham gia của hơn 40 công ty công nghệ lớn. Động thái này nhằm giảm nguy cơ mô hình AI bị tin tặc lợi dụng để tìm và khai thác lỗ hổng bảo mật.
Theo Anthropic, Claude Mythos đã phát hiện hàng nghìn lỗ hổng rủi ro cao trên các hệ điều hành và trình duyệt web phổ biến. Trong số đó có một lỗ hổng trên OpenBSD tồn tại suốt 27 năm nhưng chưa từng bị phát hiện, một lỗi trong bộ mã hóa video FFmpeg dù phần mềm này đã trải qua hơn 5 triệu lượt kiểm thử tự động, cùng một lỗ hổng trong nhân Linux có thể cho phép kẻ tấn công chiếm quyền kiểm soát hoàn toàn thiết bị của người dùng.
Việc dùng AI để tìm lỗ hổng bảo mật không phải điều mới. Tuy nhiên, theo giới quan sát, điểm đáng lo ở Mythos nằm ở năng lực suy luận nâng cao của mô hình này.
Casey Newton, nhà sáng lập kiêm biên tập viên Platformer, cho rằng các mô hình trước đây chủ yếu dừng ở khả năng phát hiện từng lỗ hổng riêng lẻ, trong khi Mythos có thể tìm ra 5 lỗ hổng trong cùng một phần mềm rồi kết nối chúng thành một chuỗi tấn công.
Newton cũng dẫn quan điểm từ Anthropic rằng khi kết hợp năng lực này với khả năng vận hành tự động trong thời gian dài, gần như không cần can thiệp của con người, mối đe dọa an ninh mạng có thể tiến tới một “điểm uốn”.
Các công ty tham gia dự án Glasswing gồm Apple, Google, Microsoft, Cisco và Broadcom. Theo kế hoạch, các bên sẽ rà soát những hệ thống mã nguồn mở quan trọng và khắc phục các lỗ hổng được phát hiện.
Anthony Grieco, Giám đốc an ninh của Cisco, nhận định năng lực AI đã vượt qua một ngưỡng tới hạn, khiến mức độ cấp bách trong bảo vệ hạ tầng trọng yếu thay đổi về bản chất. Trong khi đó, Alex Stamos, Giám đốc sản phẩm của công ty an ninh mạng Corridor, cảnh báo các mô hình open-weight có thể chỉ còn chưa đầy 6 tháng là bắt kịp năng lực tìm lỗi của các mô hình nền tảng. Khi đó, theo ông, bất kỳ nhóm tấn công ransomware nào cũng có thể tự phát hiện lỗ hổng và biến chúng thành công cụ tấn công mà hầu như không để lại dấu vết.
Newton cũng đặt vấn đề về mức độ tập trung quyền lực quanh Mythos, cho rằng ảnh hưởng của một công ty trong việc phát hiện lỗ hổng bảo mật đang trở nên quá lớn.
Ông dẫn lời Kelsey Piper, người phụ trách chuyên mục Argument, cho rằng một vấn đề chưa được xử lý thỏa đáng là khả năng một doanh nghiệp tư nhân có thể nắm trong tay số lượng lỗ hổng zero-day “đáng kinh ngạc” đối với gần như mọi dự án phần mềm mà họ biết tới.
Theo Newton, quyền lực càng tập trung thì rủi ro càng lớn. Ông cho rằng động cơ đánh cắp trọng số mô hình của Anthropic đã tăng mạnh, đồng thời nhận xét Glasswing đang dựa trên một giả định gây nhiều bất an: cách duy nhất để phòng vệ trước các mô hình AI nguy hiểm là phải phát triển chúng trước, trong khi Anthropic lại đang thúc đẩy điều này trong một môi trường gần như chưa có quy định kiểm soát.