Ảnh: Reve AI

Nhu cầu đối với agentic AI, dòng AI có thể tự động xử lý tác vụ, đang tăng mạnh và làm trầm trọng thêm tình trạng thiếu hụt năng lực tính toán trên thị trường. Hệ quả là chi phí hạ tầng AI leo thang, trong khi doanh nghiệp ngày càng khó mở rộng triển khai công nghệ này.

Theo Wall Street Journal (WSJ), giá thuê GPU theo giờ, hạ tầng cốt lõi của AI, đã tăng mạnh từ mùa thu năm ngoái. Cùng lúc, Anthropic vấp phải phản ứng từ khách hàng sau khi siết hạn mức sử dụng tài nguyên tính toán trong giờ cao điểm.

OpenAI cũng chịu áp lực tương tự. Gần đây, công ty đã tạm dừng Sora, công cụ AI tạo video. Theo phân tích, động thái này liên quan đến việc OpenAI phải ưu tiên phân bổ năng lực tính toán cho mảng lập trình và các sản phẩm dành cho doanh nghiệp.

WSJ cho biết lượng token được sử dụng thông qua API của OpenAI đã tăng từ 6 tỷ token mỗi phút vào tháng 10 năm ngoái lên 15 tỷ token mỗi phút vào cuối tháng 3. Token là đơn vị văn bản cơ bản mà mô hình AI xử lý, đồng thời phản ánh mức tiêu thụ năng lực tính toán.

Chi phí GPU cũng tăng nhanh. CoreWeave, nhà cung cấp dịch vụ đám mây chuyên cho AI, đã nâng giá hơn 20% vào cuối năm ngoái, đồng thời yêu cầu một số khách hàng quy mô nhỏ kéo dài thời hạn cam kết từ 1 năm lên 3 năm. Theo Ornn, giá giao ngay của nhiều dòng GPU Nvidia trên các nền tảng đám mây đã tăng đáng kể trong vài tháng gần đây. Riêng giá thuê theo giờ của chip Blackwell mới nhất đã tăng 48% so với hai tháng trước.

Tình trạng thiếu hụt năng lực tính toán cũng ảnh hưởng trực tiếp đến hoạt động dịch vụ của các công ty AI. Anthropic, một doanh nghiệp tăng trưởng nhanh trong lĩnh vực này, liên tục gặp sự cố gián đoạn từ giữa tháng 2, khiến một số khách hàng chuyển sang các mô hình AI khác.

WSJ nhận định tình trạng khan hiếm tài nguyên tính toán trên thị trường AI khó có thể sớm được giải quyết.

JJ. Cardwell, CEO của Vultr, cho biết công ty đang ghi nhận mức thiếu hụt dung lượng nghiêm trọng nhất trong hơn 5 năm hoạt động. Theo ông, nhiều người có thể đặt câu hỏi vì sao doanh nghiệp không bổ sung thêm thiết bị, nhưng trở ngại nằm ở thời gian giao hàng quá dài. Việc xây dựng trung tâm dữ liệu cũng mất nhiều thời gian, trong khi nguồn điện phục vụ các dự án đến năm 2026 gần như đã được đặt kín.

Ben Poladian, kỹ sư kiêm nhà đầu tư công nghệ, nhận định: “Người ta vẫn nói nhiều về dầu mỏ, nhưng thứ khan hiếm nhất hiện nay là token”. Ông cho rằng AI hiện không còn dừng ở những chatbot đơn giản chỉ để hỏi công thức nấu ăn trước tủ lạnh, mà đã bắt đầu điều phối công việc và ngày càng thông minh hơn.

Từ khóa

#trí tuệ nhân tạo #agentic AI #GPU #điện toán đám mây #OpenAI #Anthropic #Nvidia #CoreWeave #Vultr #token #hạ tầng AI
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.