Xu hướng áp dụng “policy as code” - viết các quy tắc bảo mật và tuân thủ dưới dạng mã - đang mở rộng tại nhiều doanh nghiệp. Cùng với đó, việc dùng trí tuệ nhân tạo (AI) để tạo policy as code cũng gia tăng, nhưng giới chuyên gia cảnh báo policy do AI sinh ra có thể đúng về cú pháp nhưng sai về nội dung, từ đó vô tình cấp quyền truy cập vượt phạm vi cho phép.
Trao đổi với SecurityWeek, Bachal Gupta, kỹ sư bảo mật cao cấp tại Apple và cũng là nhà nghiên cứu độc lập, cho biết các policy do mô hình ngôn ngữ lớn (LLM) tạo ra “thường đúng về mặt cú pháp nhưng sai về mặt ý nghĩa”. Theo ông, chỉ cần thiếu một điều kiện hoặc diễn giải sai một thuộc tính, phạm vi truy cập có thể thay đổi hoàn toàn.
Gupta nêu ra 5 nhóm lỗi phổ biến. Đầu tiên là thiếu điều kiện theo ngữ cảnh. Với những policy cần giới hạn truy cập theo khu vực, phòng ban hoặc quyền sở hữu, chỉ cần bỏ sót điều kiện này, policy vẫn có thể trông hợp lệ nhưng lại được áp dụng trên diện rộng.
Lỗi thứ hai là bỏ sót logic từ chối mặc định. Về bản chất, chính sách kiểm soát truy cập thường dựa trên nguyên tắc mặc định từ chối và chỉ cho phép các ngoại lệ cụ thể. Tuy nhiên, AI đôi khi chỉ viết phần ngoại lệ mà không thể hiện đầy đủ ràng buộc nền tảng này.
Thứ ba là hiện tượng “hallucination”. AI có thể đưa vào policy những thuộc tính vốn không tồn tại trong hệ thống. Trong trường hợp đó, mã có thể vẫn được chấp nhận về mặt cú pháp nhưng khi vận hành lại cho ra kết quả ngoài dự liệu.
Nhóm lỗi thứ tư là đơn giản hóa quá mức các điều kiện về thời gian và tình huống. Những quyền truy cập vốn chỉ được phép trong khung giờ nhất định hoặc sau một quy trình phê duyệt có thể bị biến thành quyền truy cập thường trực, không kèm điều kiện.
Lỗi thứ năm là phân loại sai hành động. Khi cố gắng giới hạn các thao tác nhạy cảm như xóa dữ liệu, policy có thể vô tình chặn một phạm vi rộng hơn dự kiến, hoặc thậm chí chặn nhầm một thao tác hoàn toàn khác.
Theo Gupta, các lỗi này thường không khiến hệ thống báo lỗi hay phát tín hiệu cảnh báo rõ ràng, mà âm thầm mở rộng phạm vi truy cập theo thời gian. Ông nhấn mạnh rủi ro lớn hơn nằm ở chỗ policy không phải chỉ được tạo một lần rồi kết thúc; chúng liên tục được tạo mới, chỉnh sửa và triển khai lặp đi lặp lại, khiến các sai sót nhỏ có thể tích tụ.
Gupta cho rằng nếu quy trình tạo policy thiếu độ tin cậy, rủi ro có thể lan ra toàn bộ hệ thống. Khi những khiếm khuyết nhỏ xuất hiện trong hàng nghìn policy, từng lỗi riêng lẻ có thể trông không nghiêm trọng, nhưng cộng dồn lại sẽ hình thành một bề mặt tấn công khó nhận biết.
Dù vậy, ông không cho rằng doanh nghiệp nên từ bỏ AI. Theo Gupta, điều cần thay đổi là cách thiết lập niềm tin với các policy do AI tạo ra: không mặc định xem đầu ra là chính xác, mà phải bổ sung bước kiểm chứng giữa khâu tạo và khâu đưa vào áp dụng. “Tự động hóa không nên là đích đến. Mục tiêu phải là độ chính xác, khả năng kiểm toán và niềm tin”, ông nói, đồng thời nhấn mạnh rằng trong kiểm soát truy cập, “gần đúng” là chưa đủ.