Doanh nghiệp Mỹ siết chi tiêu AI, đẩy mạnh định tuyến mô hình

Trọng tâm của cuộc đua AI đang chuyển từ mô hình mạnh hơn sang dùng đúng mô hình cho đúng tác vụ. Ảnh: Shutterstock

Các doanh nghiệp Mỹ đang tăng tốc áp dụng chiến lược định tuyến mô hình AI, tức phân bổ các mô hình khác nhau cho từng tác vụ nhằm cắt giảm chi phí. Xu hướng này cho thấy ưu tiên của doanh nghiệp đang dịch chuyển từ chạy theo mô hình mạnh nhất sang sử dụng AI hiệu quả hơn về mặt ngân sách.

Theo CNBC ngày 5/6 (giờ địa phương), thay vì dồn toàn bộ truy vấn vào những mô hình lớn và đắt đỏ nhất, nhiều doanh nghiệp chỉ dùng các mô hình này cho tác vụ phức tạp, còn những công việc đơn giản được chuyển sang các mô hình rẻ hơn và xử lý nhanh hơn.

Động thái này diễn ra trong bối cảnh doanh nghiệp siết chặt kiểm soát ngân sách nội bộ. Các giám đốc tài chính và hội đồng quản trị không còn chấp nhận việc chi mạnh cho AI nhưng hiệu quả không tương xứng, và bắt đầu đặt câu hỏi liệu mọi tác vụ có thực sự cần đến mô hình đắt nhất hay không.

Trước đây, doanh nghiệp thường mặc định chọn mô hình có hiệu năng cao nhất. Tuy nhiên, khi chi phí thực tế vượt xa ngân sách dự kiến, nhiều công ty buộc phải đẩy nhanh việc điều chỉnh cơ cấu chi tiêu.

Scott Wu, CEO của Cognition, công ty phát triển tác nhân lập trình Devin, cho biết mức tiết kiệm đặc biệt rõ rệt với các công việc lặp lại. Theo ông, với những tác vụ đã được chuẩn hóa, việc dùng mô hình phù hợp với yêu cầu có thể nâng hiệu quả chi phí lên gấp 5-10 lần.

Ví dụ được ông đưa ra là câu hỏi đơn giản như “ai là tổng thống thứ ba của Mỹ”. Dù dùng mô hình đắt hay rẻ, câu trả lời vẫn là Thomas Jefferson, nên không có nhiều lý do để liên tục sử dụng mô hình chi phí cao cho dạng tác vụ này.

Dù vậy, phần lớn doanh nghiệp hiện vẫn chưa áp dụng rộng rãi chiến lược định tuyến mô hình. Arvind Jain, CEO của Glean, ước tính khoảng 95% mức sử dụng AI trong doanh nghiệp hiện vẫn chạy trên các mô hình frontier đắt nhất.

Điều đó đồng nghĩa nhiều tác vụ vốn có thể được xử lý bằng mô hình rẻ hơn vẫn đang bị đẩy lên nhóm mô hình có chi phí cao.

Áp lực chi phí cũng đang ảnh hưởng đến các tập đoàn công nghệ lớn. Jeetu Patel, Giám đốc sản phẩm của Cisco, cho biết nếu chi phí token vào khoảng 200 USD mỗi nhân viên mỗi tuần, tổng chi một năm sẽ lên tới khoảng 10.400 USD cho mỗi người.

Với doanh nghiệp có 90.000 nhân viên, khoản chi này có thể lên tới 900 triệu USD mỗi năm. Cisco cho biết 30.000 kỹ sư của hãng đang phát triển sản phẩm với phần lớn nội dung được AI hỗ trợ viết ra. Tuy nhiên, khi chi tiêu thực tế vượt xa ngân sách nội bộ, công ty đã phải điều chỉnh lại cách phân bổ nguồn lực.

Theo Patel, Cisco đang tái cơ cấu ngân sách theo hướng ưu tiên chi cho token hơn các khoản mục khác.

Các công ty AI cũng đã nhận thấy sự dè dặt này từ phía khách hàng. Cognition triển khai chương trình “cam kết năng suất AI”, theo đó nếu Devin tạo ra giá trị kỹ thuật thấp hơn số tiền khách hàng đã chi trả, công ty sẽ chịu chi phí sử dụng cho đến khi hiệu quả được cân bằng, với mức tối đa 10 triệu USD.

Scott Wu cho biết đây là cách đối diện trực tiếp với bài toán tỷ suất hoàn vốn (ROI), một trong những mối quan tâm lớn nhất của ngành hiện nay. Ông nhấn mạnh doanh nghiệp nên đo lường mức giảm thời gian làm việc thực tế của kỹ sư, thay vì chỉ nhìn vào các chỉ số hoạt động như lượng token tiêu thụ hay số dòng mã được tạo ra.

Ông cũng cảnh báo doanh nghiệp có thể tiêu tốn hàng tỷ token mà không tạo ra giá trị tương xứng. Theo ông, điều cần nhắm tới là đầu ra cuối cùng, không phải mức độ hoạt động của hệ thống.

Xu hướng này có thể tạo thêm áp lực lên các nhà cung cấp mô hình frontier như OpenAI và Anthropic. Nếu doanh nghiệp chuyển một khối lượng lớn tác vụ đơn giản sang các mô hình mã nguồn mở giá rẻ, bao gồm cả mô hình từ Trung Quốc, các nhà cung cấp mô hình đắt tiền sẽ khó duy trì doanh thu trên mọi loại công việc như trước.

Khi chỉ còn đảm nhận các tác vụ phức tạp và khó nhất, họ vẫn có thể giữ mức giá premium, nhưng tỷ trọng khối lượng công việc trong toàn thị trường có thể giảm xuống.

Dù vậy, điều đó không có nghĩa giá trị của các mô hình frontier biến mất. Patel cho rằng công nghệ tiên tiến vẫn sẽ giữ vai trò quan trọng, nhưng cơ chế định giá nhiều khả năng sẽ thay đổi.

Theo ông, các phòng thí nghiệm AI cần giúp khách hàng sử dụng mô hình hiệu quả hơn, thay vì chỉ tìm cách tăng giá.

Cuối cùng, câu hỏi của doanh nghiệp không còn là có tiếp tục tăng chi khi chi phí AI leo thang hay không, mà là làm sao dùng AI thông minh hơn. Trong bối cảnh đó, quyền định giá có thể dần dịch chuyển từ các nhà bán AI cao cấp sang phía doanh nghiệp mua.

Các mô hình frontier vẫn có thể thu phí cao cho những tác vụ khó nhất, nhưng tỷ trọng các tác vụ còn lại sẽ là biến số quan trọng ảnh hưởng đến định giá tương lai của những công ty AI lớn.

Jinju Hong hongjj@d-today.co.kr

Doanh nghiệp Mỹ siết chi tiêu AI, đẩy mạnh định tuyến mô hình

Tác vụ khó dùng mô hình đắt, việc đơn giản chuyển sang mô hình rẻ hơn

Đang tạo...

Tóm tắt AI

Doanh nghiệp Mỹ đang điều phối mô hình AI theo từng tác vụ để tối ưu chi phí, qua đó tạo thêm áp lực lên các nhà cung cấp mô hình frontier như OpenAI và Anthropic.

Từ khóa