Mối lo bảo mật liên quan đến mô hình AI Claude Mythos của Anthropic đang làm nóng tranh luận về việc thay đổi mô hình phòng thủ. Ảnh: Shutterstock

Mô hình AI Claude Mythos của Anthropic đang làm gia tăng lo ngại trong giới quản lý và doanh nghiệp, khi công cụ này được cho là có thể đồng thời phát hiện lỗ hổng và tạo mã khai thác. Diễn biến mới khiến nhiều ý kiến cho rằng chiến lược ứng phó an ninh mạng cần được điều chỉnh lại từ gốc.

Ngày 7/4, Mythos được giới thiệu dưới dạng bản preview trong khuôn khổ sáng kiến Project Glasswing, dành cho 12 tập đoàn công nghệ lớn và hơn 40 doanh nghiệp quy mô lớn. Theo thông tin được công bố, mô hình này thể hiện năng lực vượt trội so với các AI trước đây trong việc tìm lỗ hổng và triển khai tấn công. Một ví dụ được nhắc tới là khả năng phát hiện một lỗ hổng tồn tại suốt 27 năm trên OpenBSD, hệ điều hành vốn được đánh giá cao về độ an toàn.

Báo cáo Mythos Ready do Liên minh An ninh Đám mây (CSA) công bố gần đây cho biết khoảng thời gian từ khi lỗ hổng được phát hiện đến lúc bị khai thác đã giảm mạnh, từ 2,3 năm vào 2018 xuống còn 20 giờ vào 2026. Theo CSA, khi tốc độ tấn công dựa trên AI tăng vọt, khả năng phản ứng của con người gần như không còn theo kịp.

Báo cáo cũng cho hay bản preview Claude Mythos có thể tự động phát hiện các lỗ hổng nghiêm trọng trên những hệ điều hành và trình duyệt phổ biến, đồng thời tạo ra mã tấn công có thể hoạt động mà không cần con người can thiệp. CSA đánh giá quy trình này diễn ra nhanh hơn và ở quy mô lớn hơn bất kỳ công nghệ nào trước đó.

Trên thực tế, Anthropic đã thử khai thác lỗ hổng nhắm vào engine JavaScript của Firefox 147 thuộc Mozilla Foundation bằng hai mô hình Claude Opus 4.6 và Mythos. Kết quả, Mythos khai thác thành công 181 lần, trong khi Opus 4.6 chỉ thành công hai lần.

◆ “Cần gấp cơ chế ứng phó cấp quốc gia”

Sau khi năng lực phát hiện lỗ hổng và xâm nhập của Mythos được xác nhận, Chính phủ Hàn Quốc đã bắt đầu các cuộc rà soát khẩn. Bộ Khoa học và ICT cùng Ủy ban Dịch vụ Tài chính đã tổ chức họp, tập trung trao đổi với các doanh nghiệp lớn về biện pháp tăng cường chính sách bảo mật. Ủy ban Chiến lược AI Quốc gia cũng đang thảo luận phương án nâng dự án “mô hình nền tảng AI độc lập” theo hướng tăng cường năng lực an ninh.

Theo giới chuyên gia, Chính phủ không nên dừng ở mức cảnh báo mà cần tăng vai trò điều phối trung tâm, bao gồm chuẩn hóa việc chia sẻ thông tin về lỗ hổng và quy trình ứng phó. Để đối phó với các mối đe dọa bảo mật do AI tạo ra, cơ chế quản trị an ninh cũng cần được tái cấu trúc toàn diện.

Giáo sư danh dự Yeom Heung-yeol, Khoa An toàn thông tin, Đại học Soonchunhyang, nhận định đây có thể là một bước ngoặt đối với an ninh mạng. Ông cho biết trước đây việc vá lỗ hổng có thể kéo dài vài tháng, nhưng nay thời gian này có thể rút xuống dưới một ngày, buộc cơ chế quản trị phải được thiết lập lại để tăng tốc độ vá lỗi.

Theo ông Yeom, yếu tố then chốt là rút ngắn tối đa thời gian hoàn tất bản vá bảo mật, đồng thời xây dựng một hệ thống ứng phó có cấu trúc ở cấp quốc gia.

Giáo sư Hwang Seok-jin, Trường Sau đại học Quốc tế về An toàn thông tin thuộc Đại học Dongguk, cũng nhấn mạnh sự cần thiết phải thay đổi cách ứng phó. Ông cho rằng phản ứng riêng lẻ mỗi khi xuất hiện một AI mới có những giới hạn rõ rệt, và Hàn Quốc cần sớm xây dựng kiến trúc ứng phó ở cấp quốc gia, trong đó có các nguyên tắc như tối thiểu hóa quyền truy cập, kiểm toán lịch sử sử dụng và cơ chế báo cáo sự cố.

◆ “Dùng AI chặn AI”, đẩy nhanh phòng thủ tự động

Ở góc độ kỹ thuật, nhiều đánh giá cho rằng việc điều chỉnh chiến lược là không thể tránh khỏi. Thay vì chỉ gia cố các hệ thống hiện có, ngành an ninh mạng cần chuyển sang mô hình phòng thủ tự động để đối phó với các cuộc tấn công dựa trên AI.

Giáo sư Hwang cho rằng trọng tâm bảo mật cần được chuyển từ khâu kiểm tra thủ công sang phòng thủ tự động, với một quy trình dựa trên AI bao trùm toàn bộ các bước từ phát hiện, ra quyết định đến phản ứng.

Cùng lúc, khoảng cách công nghệ cũng nổi lên như một biến số lớn. Nếu các mô hình AI hiệu năng cao chỉ được cung cấp cho một nhóm hạn chế, lo ngại về sự bất đối xứng trong năng lực bảo mật sẽ càng gia tăng. CEO Yoon Du-sik của Iroun&Company cảnh báo rằng nếu Mythos không có guardrail và chỉ được cung cấp cho một số ít bên, các quốc gia hoặc tổ chức nằm ngoài nhóm đó gần như chắc chắn sẽ rơi vào thế bị động.

Ông Yoon cũng chỉ ra rằng trong nhiều môi trường thực tế, ngay cả khi lỗ hổng đã xuất hiện thì việc vá lỗi vẫn không thể thực hiện ngay, do hệ điều hành hoặc phần mềm không được cập nhật, đồng thời thiếu hoạt động quản lý tài sản CNTT. Theo ông, nền tảng quan trọng nhất là phải nắm chính xác tài sản CNTT và các lỗ hổng của tổ chức, sau đó duy trì quản lý liên tục.

Trong khi đó, ngày 16/4, Anthropic công bố Opus 4.7 với một phần năng lực đã được hạ xuống so với Mythos. Trên blog chính thức, công ty cho biết năng lực an ninh mạng của Opus 4.7 được thiết kế để không đạt tới mức của bản preview Mythos, đồng thời quá trình huấn luyện cũng bao gồm các thử nghiệm nhằm thu hẹp chức năng này. Ngoài ra, OpenAI cũng ra mắt GPT-5.4-Cyber, mô hình được tối ưu cho việc phát hiện lỗ hổng bảo mật, đồng thời áp dụng cơ chế an toàn khi ưu tiên cung cấp trước cho một số chuyên gia.

Theo giới trong ngành, những động thái này được xem là tín hiệu chững lại do các công ty đã nhận thức rõ hơn về rủi ro bảo mật từ AI hiệu năng cao. Một nguồn tin trong ngành an ninh mạng nhận định cả Anthropic lẫn OpenAI đều hiểu rất rõ tác động nếu các mô hình này bị lạm dụng, và có thể đang cân nhắc kỹ phạm vi phát hành chính thức.

Từ khóa

#Anthropic #Claude Mythos #AI #an ninh mạng #CSA #phòng thủ tự động #lỗ hổng bảo mật
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.