Anthropic giới thiệu mô hình AI Claude Opus 4.8. Ảnh: Anthropic

Anthropic ngày 28/5 công bố ra mắt toàn cầu mô hình AI mới Claude Opus 4.8, tập trung cải thiện khả năng lập trình, suy luận và độ an toàn, trong khi vẫn giữ nguyên mức giá so với phiên bản trước.

Theo 9to5Mac và một số hãng tin công nghệ, bản cập nhật này được tung ra khoảng 6 tuần sau khi Claude Opus 4.7 ra mắt hôm 16/4.

Anthropic cho biết Claude Opus 4.8 được phát triển theo hướng trở thành một “đối tác cộng tác” hiệu quả hơn, với trọng tâm là nâng hiệu suất và cải thiện cách mô hình phản hồi. Công ty đã tinh chỉnh khả năng đánh giá dựa trên nền tảng của Opus 4.7, giúp mô hình phản ánh tiến độ công việc trung thực hơn và tăng năng lực xử lý độc lập trong thời gian dài.

Theo kết quả thử nghiệm ban đầu, Claude Opus 4.8 giảm xu hướng đưa ra các khẳng định thiếu cơ sở và cho thấy mức độ tin cậy cao hơn trong quá trình làm việc. Anthropic cho biết mô hình mới có khả năng đánh giá sắc bén hơn, đồng thời hạn chế các nhận định không bám sát dữ kiện thực tế.

Một điểm đáng chú ý là tỷ lệ bỏ sót lỗi trong đoạn mã do chính mô hình tạo ra đã giảm xuống còn khoảng một phần tư so với Opus 4.7. Theo Anthropic, điều này giúp nâng độ chính xác trong các môi trường phát triển phần mềm đòi hỏi nhiều vòng rà soát và chỉnh sửa lặp lại.

Về mức độ căn chỉnh, công ty cho biết Claude Opus 4.8 đạt mức cao nhất từ trước đến nay theo các chỉ số hành vi mong muốn, trong khi tỷ lệ hành vi ngoài kỳ vọng giảm mạnh so với Opus 4.7. Anthropic cho rằng mô hình mới vừa cải thiện khả năng thực thi tác vụ, vừa tăng khả năng kiểm soát và độ an toàn.

Công ty cũng công bố một loạt chỉ số benchmark. Ở bài đánh giá lập trình dạng agent, điểm số tăng từ 64,3% lên 69,2%. Với bài đánh giá suy luận đa lĩnh vực có sử dụng công cụ, điểm tăng từ 54,7% lên 57,9%.

Trong các hạng mục khác, điểm sử dụng máy tính dạng agent tăng từ 82,8% lên 83,4%; điểm tác vụ tri thức tăng từ 1.753 lên 1.890; còn điểm phân tích tài chính dạng agent tăng từ 51,5% lên 53,9%.

Về giá, Anthropic cho biết Claude Opus 4.8 vẫn giữ nguyên mức phí như Opus 4.7. Giá tiêu chuẩn là 5 USD cho mỗi 1 triệu token đầu vào và 25 USD cho mỗi 1 triệu token đầu ra.

Đối với chế độ xử lý nhanh của Opus 4.8, vận tốc được cho là cao hơn khoảng 2,5 lần. Mức giá áp dụng là 10 USD cho mỗi 1 triệu token đầu vào và 50 USD cho mỗi 1 triệu token đầu ra. Anthropic cho biết chế độ này hiện nhanh hơn khoảng 2,5 lần, trong khi chi phí đã giảm xuống còn khoảng một phần ba so với trước.

Môi trường dành cho lập trình viên Claude Code cũng được nâng cấp. Theo Anthropic, Opus 4.8 mặc định chạy ở mức độ suy luận cao. Thiết lập này sử dụng lượng token tương đương Opus 4.7 trong các tác vụ lập trình, nhưng mang lại hiệu năng tốt hơn.

Công ty cũng có kế hoạch nâng giới hạn sử dụng Claude Code với các thiết lập “hiệu năng bổ sung” và “hiệu năng tối đa”.

Ngoài ra, Anthropic bổ sung một số tính năng hướng tới các tác vụ quy mô lớn. Trong đó, Dynamic workflow được phát hành dưới dạng bản xem trước nghiên cứu nhằm hỗ trợ Claude Code xử lý những công việc lớn hơn.

Trên Claude Cowork và claude.ai, công ty bổ sung công cụ điều chỉnh mức độ suy luận cho phản hồi ngay bên cạnh bộ chọn mô hình.

Anthropic đồng thời thay đổi Message API. Cấu trúc mới cho phép chèn thông điệp hệ thống trực tiếp vào mảng messages, giúp nhà phát triển điều chỉnh chỉ dẫn ngay trong quá trình xử lý mà không phải chờ đến lượt nhập của người dùng.

Theo công ty, hệ thống vẫn duy trì khả năng lưu bộ nhớ đệm prompt và tính năng định tuyến như trước.

Anthropic cũng công bố kế hoạch tiếp theo, gồm việc chuẩn bị một mô hình chi phí thấp với hiệu năng tương đương. Công ty cho biết sau khi áp dụng các biện pháp tăng cường an toàn mạng dựa trên Project Glasswing, hãng sẽ mở rộng phạm vi phát hành mô hình cấp Mythos trong vài tuần tới.

Trong bối cảnh cạnh tranh với OpenAI ngày càng gay gắt, bản cập nhật lần này cho thấy Anthropic đang tập trung vào hiệu quả sử dụng thực tế. Công ty nhấn mạnh các điểm như phát hiện lỗi lập trình, khả năng làm việc tự chủ trong thời gian dài và tính trung thực trong phản hồi để đẩy nhanh cuộc cạnh tranh giành khách hàng là lập trình viên và doanh nghiệp.

Từ khóa

#Anthropic #Claude Opus 4.8 #AI #mô hình AI #lập trình #suy luận #Claude Code #Message API
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.