Chi phí vận hành AI tạo sinh đang tăng trở lại khi OpenAI và Google đồng loạt điều chỉnh giá token, trong khi phần cứng mới chưa thể sớm tạo ra tác động rõ rệt lên chi phí suy luận. Diễn biến này làm gia tăng lo ngại về gánh nặng tài chính đối với doanh nghiệp đang triển khai AI vào ứng dụng và dịch vụ.
Theo The Register, áp lực chi phí đang trở thành bài toán thực tế đối với các lãnh đạo từng kỳ vọng có thể thay thế một phần nhân sự bằng AI với mức chi thấp hơn.
Các công cụ hỗ trợ lập trình như Claude Code, Codex và GitHub Copilot hiện được xem là một trong những mảng ứng dụng thành công rõ nét nhất của AI. Tuy nhiên, phần lớn trung tâm dữ liệu hiện nay lại được xây dựng chủ yếu cho huấn luyện mô hình, thay vì phục vụ kịch bản suy luận với lượng lớn người dùng truy cập đồng thời. Huấn luyện và suy luận là hai bài toán hạ tầng rất khác nhau.
The Register cho rằng đây cũng là một trong những nguyên nhân khiến Nvidia được cho là đã chi 20 tỷ USD để mua startup chip AI có tên Grok. Cùng với đó, AMD, AWS, Intel và Google đều đang thiết kế lại GPU và bộ tăng tốc AI nhằm giảm chi phí trên mỗi token. Dù vậy, phần lớn phần cứng này dự kiến chỉ ra mắt trong nửa cuối năm nay và phải tới đầu hoặc giữa năm 2027 mới có thể được triển khai ở quy mô lớn.
Trong bối cảnh đó, các nhà phát triển mô hình dường như đang thăm dò mức chấp nhận của người dùng: liệu họ có tiếp tục sử dụng khi giá tăng, một khi đã phụ thuộc nhiều hơn vào AI.
OpenAI đã tăng gấp đôi giá token khi ra mắt GPT-5.5, lên 5 USD cho mỗi 1 triệu token đầu vào và 30 USD cho đầu ra. Google cũng điều chỉnh theo hướng tương tự khi Gemini Flash 3.5 vừa ra mắt có giá cao hơn 3-6 lần so với phiên bản trước.
The Register cho biết các công cụ AI dạng agent tiêu thụ token nhiều hơn chatbot thông thường tới hàng chục lần, khiến áp lực tăng giá càng lớn.
Microsoft cũng đã bỏ cơ chế tính phí GitHub Copilot theo số lượng người dùng và chuyển sang mô hình tính theo mức sử dụng. Anthropic hiện cũng đang rà soát lại cách định giá.
The Register dự báo chi phí giao việc cho AI hiện vào khoảng 30 USD mỗi giờ, trong khi thuê người là 40 USD mỗi giờ, chưa bao gồm phúc lợi. Theo lập luận này, các công ty AI vẫn có thể duy trì mặt bằng giá cao nhờ lợi thế “rẻ hơn con người”. Về lâu dài, giá AI có thể không còn được niêm yết theo token mà theo “chi phí thay thế một nhân sự toàn thời gian”.
Kỳ vọng cạnh tranh sẽ sớm kéo giá xuống cũng không dễ thành hiện thực. Theo The Register, các nhà phát triển mô hình lớn hiện vẫn đang thua lỗ, nên không còn nhiều dư địa để tiếp tục hạ giá.