Cisco đã công bố Model Provenance Kit, công cụ mã nguồn mở nhằm hỗ trợ doanh nghiệp xác minh nguồn gốc các mô hình trí tuệ nhân tạo (AI) lấy từ nguồn bên ngoài, qua đó giảm rủi ro về bảo mật, tuân thủ và pháp lý.
Theo SecurityWeek ngày 30/4/2026 (giờ địa phương), công cụ mới được Cisco giới thiệu trong bối cảnh ngày càng nhiều doanh nghiệp sử dụng mô hình AI từ các kho lưu trữ công khai như Hugging Face, nơi hiện có hàng triệu mô hình được đăng tải.
Cisco cho biết doanh nghiệp thường đối mặt với ba vấn đề khi sử dụng mô hình từ Hugging Face và các nguồn tương tự. Thứ nhất, họ khó theo dõi những thay đổi của mô hình theo thời gian. Thứ hai, doanh nghiệp không thể tự xác minh đầy đủ các thông tin do nhà phát triển cung cấp, bao gồm nguồn gốc mô hình, lỗ hổng bảo mật hay mức độ thiên lệch của dữ liệu huấn luyện. Thứ ba, mức độ duy trì và cập nhật giữa các nhà phát triển không đồng đều, có thể ảnh hưởng trực tiếp đến bên triển khai mô hình.
Theo Cisco, những yếu tố này có thể kéo theo rủi ro về bảo mật, tuân thủ và trách nhiệm pháp lý. Doanh nghiệp có thể vô tình triển khai mô hình đã bị cài mã độc, bị chỉnh sửa trái phép hoặc được huấn luyện trên bộ dữ liệu thiên lệch. Hãng cho biết nếu không xác định được nguồn gốc mô hình, khi xảy ra sự cố sẽ rất khó truy vết nguyên nhân gốc rễ, đồng thời không thể biết các mô hình khác trong hệ thống có bị ảnh hưởng hay không.
Model Provenance Kit gồm bộ công cụ dựa trên Python và giao diện dòng lệnh CLI. Hệ thống này phân tích metadata của từng mô hình, độ tương đồng của tokenizer và các tín hiệu ở cấp độ trọng số để tạo “dấu vân tay” cho mỗi mô hình. Các tín hiệu được sử dụng bao gồm so sánh cấu trúc embedding, lớp chuẩn hóa, hồ sơ năng lượng (energy profile) và trọng số.
Công cụ vận hành theo hai chế độ. Ở chế độ “compare”, hệ thống so sánh hai mô hình để xác định phả hệ chung. Với chế độ “scan”, công cụ đối chiếu dấu vân tay của một mô hình với cơ sở dữ liệu dấu vân tay do Cisco xây dựng nhằm tìm ra phả hệ gần nhất.
Cisco cho biết việc truy vết phả hệ mô hình ngày càng phức tạp khi mô hình trải qua các quá trình như fine-tuning, distillation, merging và repackaging. Hãng nhấn mạnh Model Provenance Kit mới chỉ là “bước đi đầu tiên” hướng tới một phương pháp xác minh nguồn gốc mô hình dựa trên bằng chứng.