Cuộc đua AI đang chuyển từ mở rộng tính năng sang bài toán hạ tầng và chi phí. Ảnh: Shutterstock

Các hãng AI lớn đang bắt đầu siết gói thuê bao giá rẻ hoặc điều chỉnh mức sử dụng khi nhu cầu tăng vọt, phản ánh áp lực ngày càng lớn lên hạ tầng tính toán và mô hình lợi nhuận của dịch vụ AI tạo sinh.

Theo Business Insider ngày 23/4 (giờ địa phương), GitHub Copilot của Microsoft đã tạm dừng nhận đăng ký mới đối với các gói Student, Pro và Pro+. Trong khi đó, Anthropic cũng đang thử nghiệm phương án hạn chế Claude Code với một bộ phận người dùng trả phí ở nhóm gói giá thấp.

Diễn biến này không đơn thuần là vấn đề vận hành, mà cho thấy những giới hạn mang tính cấu trúc của thị trường AI tạo sinh. Ở giai đoạn đầu, nhiều công ty thu hút người dùng bằng mức giá thấp và khả năng tiếp cận dễ dàng. Tuy nhiên, gần đây, các tranh cãi liên quan đến giới hạn sử dụng và việc tăng giá xuất hiện ngày càng nhiều.

Áp lực chủ yếu đến từ làn sóng AI tác nhân. Người dùng đang tận dụng các công cụ tự động hóa như OpenClo để vận hành mô hình gần như 24/7, khiến mức tiêu thụ tài nguyên tính toán vượt xa khả năng chịu tải của các gói thuê bao hiện nay. Joe Binder, Phó chủ tịch sản phẩm của GitHub, cho biết các phiên chạy song song kéo dài đã vượt ngoài phạm vi thiết kế ban đầu của gói dịch vụ, trong khi nhiều yêu cầu xử lý phát sinh với tần suất ngày càng cao đang đẩy chi phí vượt quá mức giá thuê bao.

Anthropic cũng đối mặt với sức ép tương tự. Công ty cho biết việc hạn chế một số tính năng của Claude Code với người dùng gói giá rẻ hiện mới ở giai đoạn thử nghiệm và sẽ thông báo trước nếu có thay đổi lớn. Amol Abasare, phụ trách tăng trưởng của Anthropic, nhấn mạnh các gói hiện tại ban đầu không được thiết kế cho môi trường sử dụng tác nhân kéo dài như hiện nay.

Giới phân tích cho rằng tốc độ tăng nhu cầu đã vượt xa dự báo của doanh nghiệp. Arun Chandrasekaran, nhà phân tích của Gartner, nhận định với cấu trúc sản phẩm và giá được xây dựng từ giai đoạn đầu năm 2022, việc hình thành một mô hình kinh doanh bền vững đang ngày càng khó khăn. Theo ông, doanh nghiệp lúc này phải giải hai bài toán cùng lúc: chuyển người dùng miễn phí sang trả phí và chứng minh giá trị của các mô hình mới có hiệu năng cao hơn.

Bên cạnh đó, các ràng buộc về hạ tầng tính toán theo từng khu vực cũng đang làm chi phí vận hành tăng thêm. Chất lượng dịch vụ và tốc độ xử lý có thể khác nhau tùy nơi đặt trung tâm dữ liệu, trong khi những giới hạn về cấu trúc khiến các công ty khó vận hành nhu cầu toàn cầu như một nguồn lực thống nhất. Vì vậy, người dùng ngoài Mỹ có thể gặp tình trạng quá tải sớm hơn.

Trong bối cảnh đó, dư địa ứng phó của các hãng AI không còn nhiều. Những phương án được nhắc đến gồm nâng hiệu suất mô hình, phân tán tải xử lý hoặc điều chỉnh mức ưu tiên theo từng nhóm người dùng. Điều này đồng nghĩa không chỉ công nghệ, mà cả chính sách giá và cách cung cấp dịch vụ cũng trở thành biến số quyết định.

OpenAI trước đó cũng từng thu hẹp danh mục mô hình cũ. Công ty đã rút lại kế hoạch ngừng GPT-4o vào tháng 8/2025 sau phản ứng từ người dùng, nhưng đến tháng 2/2026 vẫn chấm dứt dịch vụ này. Gần đây, hãng giới thiệu mô hình tạo ảnh mới và một tác nhân vận hành trên nền tảng đám mây cho một số người dùng trả phí, trong khi ứng dụng tạo video Sora, từng thu hút nhiều chú ý, đã thông báo đóng cửa từ tháng trước.

Theo đánh giá của ngành, cạnh tranh trên thị trường AI trong thời gian tới sẽ không chỉ nằm ở hiệu năng mô hình, mà còn ở khả năng bảo đảm và vận hành ổn định nguồn lực tính toán ở quy mô lớn.

Điều đó cũng cho thấy thị trường AI tạo sinh đang nhanh chóng chuyển từ cuộc đua tính năng sang cuộc đua về hạ tầng và lợi nhuận. Doanh nghiệp nào duy trì được năng lực tính toán theo kịp tốc độ mở rộng dịch vụ, đồng thời xây dựng được mô hình giá đủ sức gánh chi phí, sẽ có lợi thế rõ rệt.

Từ khóa

#trí tuệ nhân tạo #AI tạo sinh #GitHub Copilot #Microsoft #Anthropic #Claude Code #OpenAI #Gartner
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.