Ảnh: Shutterstock

Meta đã ký thỏa thuận triển khai hàng triệu CPU Graviton do Amazon Web Services (AWS) tự phát triển để đáp ứng nhu cầu AI ngày càng tăng, đặc biệt với các tác vụ suy luận thời gian thực của AI agent, theo TechCrunch ngày 24/4.

Graviton là dòng CPU dựa trên kiến trúc Arm. Trong khi GPU vẫn giữ vai trò chủ chốt ở khâu huấn luyện mô hình quy mô lớn, nhu cầu đối với CPU đang tăng lên cùng với sự mở rộng của AI agent trong các tác vụ như suy luận thời gian thực, viết mã, tìm kiếm và điều phối quy trình nhiều bước. Thế hệ Graviton mới nhất của AWS được phát triển để phục vụ các nhu cầu tính toán này.

Trước đó, vào tháng 8 năm ngoái, Meta cũng đã ký hợp đồng 6 năm trị giá 10 tỷ USD với Google Cloud. Amazon công bố thỏa thuận mới với Meta ngay sau khi sự kiện Google Cloud Next khép lại.

Amazon đồng thời phát triển dòng chip AI Trainium. Đầu tháng này, Anthropic cam kết chi 100 tỷ USD cho AWS trong vòng 10 năm, qua đó đảm bảo khả năng tiếp cận đáng kể với Trainium.

Thỏa thuận với Meta đặc biệt đáng chú ý khi đây là một trong những hợp đồng lớn dành cho dòng CPU do Amazon tự phát triển. Nvidia cũng đã ra mắt CPU Vera dựa trên Arm để nhắm vào mảng xử lý cho AI agent. Khác biệt là Nvidia bán chip trực tiếp, còn AWS chỉ cung cấp quyền truy cập thông qua dịch vụ đám mây.

Trong thư gửi cổ đông đầu tháng này, CEO Amazon Andy Jassy cho biết các doanh nghiệp đang tìm kiếm hiệu quả chi phí tốt hơn cho AI, đồng thời nhấn mạnh tham vọng mở rộng thị trường bằng các dòng chip tự phát triển.

Từ khóa

#Meta #Amazon Web Services #AWS #Graviton #CPU #AI agent #suy luận AI #Trainium #Nvidia #Google Cloud
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.