Chi phí triển khai trí tuệ nhân tạo (AI) tăng nhanh đang buộc nhiều doanh nghiệp thay đổi cách sử dụng công nghệ này. Thay vì phụ thuộc hoàn toàn vào các mô hình đắt đỏ, họ kết hợp nhiều mô hình theo từng nhu cầu, dùng bộ định tuyến để tự động chọn mô hình phù hợp và đẩy mạnh tận dụng mô hình nguồn mở nhằm giảm chi phí vận hành.
Theo The Information, ngày càng nhiều công ty tìm cách cắt giảm trực tiếp chi phí AI. Một trong những hướng đi phổ biến là kết hợp các mô hình giá thấp với những mô hình cao cấp của OpenAI và Anthropic tùy theo độ phức tạp của tác vụ. Cùng với đó, phần mềm bộ định tuyến mô hình, công cụ tự động chọn mô hình rẻ hơn cho các tác vụ đơn giản, đang được quan tâm nhiều hơn. Một số doanh nghiệp cũng tự tinh chỉnh mô hình nguồn mở để tiết kiệm chi phí.
Fin, công ty phát triển tác nhân AI hỗ trợ khách hàng, là một ví dụ. Doanh nghiệp này trước đây sử dụng mô hình Sonnet của Anthropic, nhưng hơn một năm trước đã chuyển sang phát triển AI tùy biến dựa trên mô hình trọng số mở (open-weight). Công ty cho biết trong vài tháng gần đây, tốc độ chuyển đổi đang tăng nhanh.
Nhờ đó, Fin tiết kiệm được hàng trăm triệu USD mỗi năm, qua đó cải thiện đáng kể biên lợi nhuận. Gần đây, công ty đã được Salesforce mua lại với giá 3,6 tỷ USD.
Không chỉ các startup, nhiều tập đoàn lớn như Meta và Uber cũng bắt đầu siết quản lý chi phí AI nội bộ. Hai công ty này từng cho phép nhân viên sử dụng AI gần như không giới hạn, nhưng sau đó phải điều chỉnh khi mức chi vượt ngân sách.
Một số doanh nghiệp còn kiểm soát chặt quyền truy cập mô hình AI của nhân viên. Theo đó, quyền sử dụng các mô hình đắt tiền được phân theo từng nhóm người dùng để tối ưu chi phí.
Ngay cả việc giảm mức suy luận của mô hình trong một số tác vụ cũng có thể kéo chi phí AI đi xuống.
UiPath, công ty phần mềm cho khối doanh nghiệp, cho biết đang sử dụng kỹ thuật thiết kế prompt để giảm tối đa phần suy luận của mô hình trước khi thực hiện tác vụ. Cách làm này được áp dụng nhiều với những công việc đã có quy trình rõ ràng, giúp chi phí của một số tác vụ giảm hơn 90%.
Dù vậy, nhu cầu với các mô hình hàng đầu của Anthropic và OpenAI vẫn tăng mạnh. Nếu những mô hình này tiếp tục duy trì ưu thế so với mô hình nguồn mở, chúng có thể hạn chế làn sóng người dùng rời đi. Tuy nhiên, nhiều đánh giá cho rằng khoảng cách năng lực giữa các mô hình tiên tiến của Anthropic, OpenAI và nhóm nguồn mở đang dần thu hẹp.
Đáng chú ý, các mô hình nguồn mở từ Trung Quốc không còn chỉ được xem là lựa chọn giá rẻ. Một số kết quả đánh giá benchmark công bố gần đây cho thấy chúng thậm chí có thể vượt OpenAI hoặc Anthropic ở một số tiêu chí. Trên thị trường AI toàn cầu, các mô hình Trung Quốc cũng đang nổi lên nhờ lợi thế chi phí.
Theo OpenRouter, dịch vụ cho phép người dùng lựa chọn giữa nhiều mô hình AI, trong tuần thứ hai của tháng 6, tỷ trọng token được xử lý bởi các mô hình nguồn mở đã lên khoảng 65%, tăng từ 34% hồi tháng 1 và 26% cùng kỳ năm ngoái. DeepSeek và MiniMax là hai cái tên nổi bật trong nhóm này.
OpenRouter cho biết các startup AI quy mô nhỏ vốn đã sử dụng mô hình nguồn mở nhiều, nhưng gần đây nhu cầu từ các tập đoàn lớn cũng tăng lên.
Factory Data, công ty phát triển công cụ phần mềm và ra mắt bộ định tuyến mô hình từ ngày 1/6, cũng ghi nhận xu hướng tương tự. Theo công ty này, lượng sử dụng mô hình nguồn mở đã tăng gấp ba lần so với tháng trước. Adobe, công ty dịch vụ CNTT Ypro và doanh nghiệp thanh toán Adyen hiện đang dùng bộ định tuyến của Factory.
Hiệu quả tiết kiệm khi thay mô hình thương mại như Anthropic bằng mô hình nguồn mở được đánh giá là rất đáng kể. Adam Sandman, CEO công ty phần mềm Inflectra, cho biết sau khi chuyển từ mô hình của Anthropic sang mô hình nguồn mở Qwen của Alibaba, chi phí AI cho tính năng phân tích hình ảnh và video trong sản phẩm phục vụ quy trình phát triển phần mềm đã giảm 99%.
Coinbase, sàn giao dịch tiền số lớn nhất Mỹ, cũng đang tận dụng các mô hình nguồn mở của Trung Quốc để tăng lượng token sử dụng nhưng vẫn cắt giảm gần một nửa chi tiêu cho AI.
Theo Brian Armstrong, CEO Coinbase, công ty đã sớm triển khai Z.ai GLM 5.2 và Moonshot Kimi 2.7. Ông cũng cho biết Coinbase đang giúp các kỹ sư theo dõi rõ hơn lượng token mà họ sử dụng. Theo Armstrong, mục tiêu không phải là hạn chế mức dùng, mà là giảm phần token bị lãng phí và xây dựng hạ tầng đủ bền vững để đáp ứng tăng trưởng theo cấp số nhân.
Trong bối cảnh AI được dự báo sẽ ngày càng được triển khai rộng trong môi trường doanh nghiệp, quản trị chi phí AI được xem là một năng lực chiến lược ngày càng quan trọng.
Một số ý kiến cho rằng chi phí AI khác về bản chất so với chi phí cloud hay SaaS, nên cần cách tiếp cận riêng.
Theo SiliconAngle, Marco Meinardi, Phó chủ tịch kiêm nhà phân tích của Gartner, nhận định trước đây chi phí chủ yếu do người dùng và hệ thống nội bộ quyết định. Nhưng với AI, chi phí có thể biến động theo cách khách hàng sử dụng ứng dụng và nhập prompt. Nói cách khác, hành vi sử dụng AI của khách hàng tác động trực tiếp đến chi phí của doanh nghiệp, nên bài toán này đòi hỏi một phương án quản trị khác.