The Register ngày 24/4 (giờ địa phương) dẫn lời Ari Herbert-Voss, CEO của startup an ninh AI RunSybil, cho biết việc phối hợp nhiều mô hình mã nguồn mở có thể mang lại hiệu quả phát hiện lỗ hổng gần tương đương Mythos của Anthropic.
Nhận định này được ông đưa ra khi phát biểu tại hội nghị Black Hat Asia diễn ra ở Singapore.
Theo Herbert-Voss, Mythos cho thấy khả năng phát hiện rộng, từ những lỗi đơn giản, dễ nhận ra đến các lỗ hổng phức tạp hơn. Ông cho rằng kết quả này đến từ hiện tượng “mở rộng siêu tuyến tính” (supralinear scaling).
Ông nói giới nghiên cứu trước đây từng giả định năng lực của LLM sẽ tăng theo tuyến tính. Tuy nhiên, thực tế cho thấy khi dữ liệu, năng lực tính toán và thời gian tăng gấp đôi, hiệu quả có thể tăng gấp bốn.
Dù vậy, Herbert-Voss cho rằng Mythos là giải pháp tốn kém và nhiều khả năng sẽ không được công bố rộng rãi. Vì thế, theo ông, nhiều tổ chức sẽ phải tìm đến các lựa chọn thay thế từ mã nguồn mở.
CEO RunSybil nhấn mạnh có thể đạt mức hiệu quả tiệm cận Mythos bằng cách vận hành đồng thời nhiều mô hình mã nguồn mở theo mô hình “scaffolding”. Cách làm này giúp bù đắp điểm mù của từng mô hình đơn lẻ, do mỗi mô hình có xu hướng phát hiện những dạng lỗi khác nhau.
Ông cũng cho rằng vẫn cần chuyên gia con người để phối hợp các mô hình mã nguồn mở và thẩm định các báo cáo lỗi do AI tạo ra. Theo Herbert-Voss, việc dùng AI để phát hiện lỗi, tương tự kỹ thuật fuzzing – tức bơm dữ liệu ngẫu nhiên vào phần mềm để tìm lỗi – dễ tạo ra quá nhiều cảnh báo, nên vai trò phán đoán của con người vẫn rất quan trọng.
Herbert-Voss dự báo các chuyên gia bảo mật “sẽ còn rất nhiều việc phải làm”. Ông đồng thời nhận định áp lực kiểm soát chi phí GPU và hạ tầng trung tâm dữ liệu sẽ thúc đẩy các đội ngũ bảo mật triển khai AI nhiều hơn, qua đó tăng cường năng lực phòng thủ.