Anthropic được cho là đang phát triển một mô hình AI mới mang tên Claude Mythos, làm dấy lên lo ngại trong giới an ninh mạng rằng công nghệ này có thể bị hacker lợi dụng để tăng tốc phát hiện và khai thác lỗ hổng, vượt quá khả năng phản ứng của phía phòng thủ.
Theo các nguồn tin quốc tế, lo ngại này xuất hiện trong bản nháp của một bài viết trên blog về Claude Mythos, được cho là đã bị Anthropic đăng nhầm rồi nhanh chóng gỡ xuống.
The Information cho biết Anthropic đang cho một số nhà nghiên cứu an ninh mạng tiếp cận sớm Claude Mythos để thu thập phản hồi. Mô hình này được cho là cải thiện đáng kể so với các phiên bản trước ở khả năng tạo và rà soát mã máy tính.
Wiz, công ty bảo mật đám mây được Google mua lại vào tháng trước, cũng dự kiến đánh giá Claude Mythos dựa trên kinh nghiệm thử nghiệm các mô hình trước đó của Anthropic.
Giám đốc công nghệ của Wiz, Ami Luttwak, nhận định các mô hình mới về cơ bản có thể sánh với những nhà nghiên cứu an ninh mạng hàng đầu thế giới. Ông cho rằng việc Anthropic cho các công ty bảo mật tiếp cận trước là “một bước đi rất quan trọng”, giúp giới nghiên cứu hình dung rõ hơn những gì có thể xảy ra.
Hồi tháng 3, nhà nghiên cứu của Anthropic Nicholas Carlini đã công bố tại một hội nghị bảo mật kết quả sử dụng Claude Code để phân tích Ghost, một nền tảng bản tin mã nguồn mở.
Theo The Information, trong suốt 13 năm, Ghost chưa từng ghi nhận lỗ hổng nghiêm trọng. Tuy nhiên, Claude Code đã tìm ra chỉ trong vài giờ một điểm yếu có thể cho phép hacker xâm nhập website của người dùng, chỉnh sửa nội dung hoặc đánh cắp dữ liệu cá nhân.
AI không chỉ rút ngắn thời gian phát hiện lỗ hổng mà còn có thể tăng tốc các bước sau tấn công. Công nghệ này có thể nhanh chóng thăm dò hệ thống đã bị xâm nhập, trích xuất dữ liệu và hoàn tất quá trình mã hóa trước khi phía phòng thủ kịp phản ứng.
Dah Lahav, nhà sáng lập startup an ninh AI Irregular Security, cho biết các mô hình AI lớn đã hiểu cách di chuyển trong mạng doanh nghiệp để tránh bị phát hiện. Trong khi đó, Giám đốc an ninh thông tin của UiPath, Scott Roberts, nói ông đang chứng kiến số trường hợp kẻ tấn công tận dụng AI ngày càng tăng và xem đây là “mức độ thay đổi như ngày điện được phát minh”.
The Information cũng lưu ý một điểm đáng chú ý: các công cụ bảo mật dùng để chặn tấn công bằng AI thường lại vận hành trên chính những mô hình mà kẻ tấn công sử dụng, như Anthropic hay OpenAI. Theo bài báo, các công ty bảo mật đang đề nghị được cấp quyền truy cập đặc biệt vào các phiên bản “ungated” — tức những bản có thể xử lý cả các yêu cầu liên quan đến hack, khác với bản công khai — nhằm chủ động tìm ra điểm yếu trong hệ thống phòng thủ của khách hàng.