Anthropic có thể phát hành phiên bản công khai của mô hình AI mới Claude Mythos vào ngày 10/6 theo giờ địa phương. Theo nguồn tin, bản phát hành này sẽ được siết guardrail đáng kể và bị hạn chế một số tính năng liên quan đến an ninh mạng so với phiên bản dành cho các đối tác trong Project Glasswing.
Thông tin trên được đăng tải trên sources.news, trang tin do nhà báo Alex Heath vận hành.
Dù vậy, nguồn tin cho biết Claude Mythos đã cải thiện đáng kể khả năng xử lý các tác vụ phức tạp, nhiều bước trong thời gian dài.
Đầu tháng 6, Anthropic cho biết sẽ mở rộng Project Glasswing tới hơn 150 tổ chức tại hơn 15 quốc gia.
Glasswing là sáng kiến hỗ trợ các tổ chức sử dụng mô hình AI của Anthropic để phát hiện lỗ hổng và xây dựng biện pháp ứng phó.
Anthropic cũng cho biết vào đầu tháng 4, hãng đã cấp quyền truy cập Claude Mythos Preview cho 50 đối tác ban đầu, trong đó có Chính phủ Mỹ.
Các tổ chức mới tham gia đợt này trải rộng ở các lĩnh vực điện lực, cấp nước, y tế, viễn thông và phần cứng, những lĩnh vực ít hiện diện trong nhóm đối tác ban đầu. Anthropic nhấn mạnh điểm chung của các đối tác là “nếu codebase bị tấn công có thể dẫn tới hậu quả thảm khốc”, đồng thời cho rằng “một cuộc tấn công lớn có thể ảnh hưởng tới hơn 100 triệu người”.