Ảnh: Reve AI

Tình trạng khan hiếm chip AI đang gia tăng sức ép lên các startup AI khi các nhà cung cấp điện toán đám mây ưu tiên phân bổ GPU cho nhu cầu nội bộ và khách hàng lớn. Hệ quả là nhiều startup phải trả chi phí cao hơn để thuê máy chủ GPU, trong khi khả năng tiếp cận hạ tầng ngày càng bị thu hẹp.

Ngay cả những startup đã gọi được lượng vốn lớn cũng không đứng ngoài vòng xoáy này. Theo The Information, nhiều công ty AI nhận đầu tư từ các quỹ như Sequoia Capital, Founders Fund, General Catalyst và Andreessen Horowitz đều đang chịu tác động trực tiếp từ cuộc khủng hoảng nguồn cung chip AI.

Diễn biến hiện nay gợi lại giai đoạn đầu năm 2023, không lâu sau khi OpenAI ra mắt ChatGPT. Khi đó, các hãng đám mây cũng ưu tiên dồn năng lực tính toán cho nhu cầu nội bộ và các khách hàng chiến lược như OpenAI.

Tuy nhiên, áp lực lần này lớn hơn khi nhu cầu lập trình bằng AI tăng mạnh. The Information cho biết các startup AI ngày càng khó tiếp cận năng lực GPU, trong bối cảnh các nhà cung cấp đám mây siết phân bổ cho khách hàng nhỏ để đáp ứng nhu cầu tăng vọt từ những nhà phát triển AI lớn như Anthropic. Thông tin này được tờ báo dẫn từ các công ty đám mây và nhà sáng lập startup.

Trong bối cảnh nguồn cung eo hẹp, các nhà cung cấp đám mây cũng có điều kiện nâng giá thuê máy chủ GPU của Nvidia, qua đó cải thiện biên lợi nhuận.

Krea, startup phát triển mô hình AI tạo ảnh, là một ví dụ điển hình. Sáu tháng trước, công ty đã ký hợp đồng thuê vài trăm chip Nvidia Blackwell với giá 2,8 USD mỗi giờ cho mỗi chip, trong thời hạn 6 tháng. Thời điểm đó, nhiều nhà cung cấp đám mây còn cạnh tranh để giành hợp đồng với Krea.

Nhưng tình hình gần đây đã đảo chiều. Khi cần bổ sung thêm máy chủ AI, Krea tìm cách mua thêm năng lực GPU song ban đầu thậm chí không thể liên hệ được với một số nhân viên kinh doanh của các hãng đám mây. Đến khi nhận được phản hồi, công ty lại phải đối mặt với mức giá cao hơn đáng kể và điều kiện chỉ được giao dịch nếu ký hợp đồng 3 năm.

Cuối cùng, Krea chấp nhận ký thêm hợp đồng thuê vài trăm chip Blackwell với mức giá cao hơn 32% so với trước đó. Thông tin này được The Information dẫn lời đồng sáng lập kiêm CEO Victor Perez.

Với các startup AI, ngay cả nhu cầu thuê khoảng 1.000 GPU cũng chưa chắc giúp họ giữ được suất từ các hãng đám mây. Nguyên nhân là thị trường vẫn có không ít khách hàng cần hạ tầng GPU ở quy mô còn lớn hơn.

Một bất lợi khác là nhiều hợp đồng thuê dịch vụ đám mây ký trước đây đang bước vào kỳ gia hạn. Theo The Information, khi các hợp đồng có thời hạn 2-3 năm hết hiệu lực, các nhà cung cấp đám mây có thể đề xuất mức giá mới cao hơn với startup hoặc phân bổ lại lượng GPU đó cho khách hàng khác.

Trước tình trạng nguồn cung thắt chặt và chi phí leo thang, các startup AI cũng bắt đầu tìm hướng ứng phó.

General Catalyst hiện thúc đẩy phương án hình thành một pool chia sẻ năng lực GPU để hỗ trợ các công ty trong danh mục tiếp cận hạ tầng này, đồng thời đàm phán trực tiếp với các nhà cung cấp đám mây. Bên cạnh đó, một số doanh nghiệp cũng cân nhắc mô hình on-premise, tức mua GPU và tự triển khai thay vì tiếp tục thuê từ đám mây.

Collide, startup phát triển AI agent, là một trong những công ty theo hướng này. Công ty cho rằng việc tự triển khai GPU có thể tốn kém hơn thuê đám mây trong ngắn hạn, nhưng mức độ bất định của thị trường thuê hạ tầng hiện nay khiến on-premise trở thành lựa chọn đáng cân nhắc. The Information dẫn lời CEO Colin McClelland cho biết Collide cũng tin rằng trong vài năm tới, tự xây dựng hạ tầng có thể rẻ hơn so với tiếp tục thuê dịch vụ đám mây.

Từ khóa

#thiếu chip AI #GPU #điện toán đám mây #Nvidia Blackwell #startup AI
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.