Coinbase cho biết công ty vẫn giữ được chi phí token gần như ổn định dù nhu cầu sử dụng trí tuệ nhân tạo tăng mạnh, nhờ điều phối prompt sang các mô hình AI có chi phí thấp hơn và chỉ dùng mô hình mạnh khi thực sự cần.
Theo Business Insider ngày 8/6 giờ địa phương, CEO Coinbase Brian Armstrong viết trên X, nền tảng trước đây là Twitter, rằng công ty đang kiểm soát chi phí bằng cách phân bổ prompt theo từng tác vụ.
Phát biểu của Armstrong được đưa ra trong bối cảnh ngành AI đang quay lại tranh luận về bài toán hiệu quả chi phí. Nhiều mô hình mới như Opus 4.8 hay GPT-5.5 được đánh giá cao về hiệu năng, nhưng cũng có thể tiêu tốn nhiều token hơn. Khi Anthropic ra mắt Opus 4.7, một số người dùng từng nêu vấn đề về giới hạn sử dụng. Điều này cho thấy ngoài cuộc đua phát triển mô hình hiệu năng cao, việc chọn đúng mô hình cho từng tác vụ đang trở thành yếu tố ngày càng quan trọng trong quá trình vận hành dịch vụ.
Armstrong dự báo cách phân bổ chi phí trong AI sẽ thay đổi rất nhanh trong thời gian tới. Ông ước tính rằng trong 12-18 tháng tới, 80% khối lượng công việc sẽ chạy trên các mô hình có chi phí thấp hơn, giảm tới 99%. Theo ông, các mô hình mới nhất sẽ không phải lựa chọn mặc định cho mọi tác vụ, mà chủ yếu được dùng cho những công việc đòi hỏi năng lực suy luận cao, như đổi mới khoa học hoặc điều phối AI agent.
Giới công nghệ có nhiều phản hồi khác nhau, nhưng không ít ý kiến đồng tình với cách tiếp cận kết hợp nhiều mô hình. Nhà đầu tư mạo hiểm Marc Andreessen nhận xét quan điểm của Armstrong là “thú vị”. Aaron Levie, CEO Box, cho rằng con số Armstrong đưa ra có phần “cực đoan”, song cũng dự báo việc ứng dụng AI sẽ tách thành hai nhóm: tác vụ đòi hỏi hiệu năng cao và tác vụ xử lý khối lượng lớn. Theo đó, những bài toán khó sẽ do các mô hình hàng đầu đảm nhiệm, còn công việc lặp lại ở quy mô lớn sẽ được giao cho các mô hình chi phí thấp.
Quan điểm “không cần tiết kiệm token” cũng đang dần hạ nhiệt. Trước đó, trong giới công nghệ từng xuất hiện xu hướng khoe mức chi token cao hoặc mức sử dụng các mô hình mới. Đặc biệt trong cộng đồng startup, không ít ý kiến cho rằng không nên quá tiết kiệm token. CEO Y Combinator Garry Tan từng khuyên các nhà sáng lập sử dụng token tích cực, còn nhà sáng lập startup Lance Yant hồi tháng 4 cũng nói rằng tiết kiệm token là điều ngốc nghếch.
Tuy nhiên, trọng tâm hiện nay đang chuyển sang phân bổ mô hình theo chi phí và tính chất công việc. Tony Gentilcore, đồng sáng lập Glean, đánh giá quan điểm của Armstrong là chính xác. Ông nói thêm rằng “người làm công nghệ đều đã biết điều này”, đồng thời cho rằng cách nhìn đơn giản hóa kiểu coi chi phí Opus là vô hạn chỉ thường thấy trong giới tài chính.
Khi doanh nghiệp bước vào giai đoạn đưa AI vào dịch vụ thực tế, câu hỏi nên dùng cấu trúc chi phí nào cho từng tác vụ đang nổi lên như một bài toán vận hành quan trọng, không kém cuộc đua phát triển mô hình mới.