Theo The Wall Street Journal ngày 4/6 (giờ địa phương), Anthropic đã kêu gọi các phòng thí nghiệm AI lớn làm chậm nhịp phát triển công nghệ này trước nguy cơ các hệ thống AI sớm có khả năng tự cải thiện.
Trong một bài viết đăng trên blog, Anthropic cảnh báo các hệ thống AI đang tiến gần giai đoạn “tự cải thiện đệ quy” (recursive self-improvement), tức có thể tự nâng cấp mà không cần sự can thiệp của con người. Công ty cho rằng việc giảm tốc phát triển AI sẽ “mang lại lợi ích cho thế giới”.
Bài viết được chấp bút bởi Marina Favaro, người đứng đầu một tổ chức nghiên cứu nội bộ của Anthropic, cùng đồng sáng lập Jack Clark.
Hai tác giả cho rằng tự cải thiện đệ quy hiện chưa xảy ra và cũng không phải là điều tất yếu. Tuy nhiên, họ nhận định kịch bản này “có thể đến trước khi phần lớn tổ chức kịp chuẩn bị”.
Anthropic vì vậy đề xuất một thỏa thuận toàn cầu nhằm làm chậm tốc độ phát triển AI, đi kèm cơ chế xác minh việc thực thi. Hai tác giả cũng so sánh vấn đề này với các hiệp ước hạt nhân, nhưng lưu ý rằng khác với các căn cứ tên lửa, hoạt động huấn luyện AI gần như không thể được bên ngoài kiểm chứng, nên việc phát hiện bên vi phạm thỏa thuận sẽ khó hơn nhiều.
Trước đó, trong một bài thuyết trình tại London hồi tháng trước, Jack Clark cũng nói rằng tự cải thiện đệ quy “có thể xảy ra trong vòng 2 năm, thậm chí sớm hơn”. Anthropic cho biết trong vài tháng tới sẽ thảo luận chủ đề này với các nhà hoạch định chính sách, giới nghiên cứu và các bên liên quan.
Tuy nhiên, một số ý kiến cho rằng các cảnh báo về an toàn AI của Anthropic có thể nhằm ghìm chân đối thủ hoặc phục vụ mục tiêu tiếp thị. Nhà đầu tư mạo hiểm David Sacks nhận định ban lãnh đạo công ty đang thúc đẩy “regulatory capture”, tức sử dụng ảnh hưởng đối với chính phủ hoặc các nhà hoạch định chính sách để tạo ra những quy định có lợi cho doanh nghiệp.