Dell Technologies cho rằng “tokenomics” sẽ trở thành yếu tố chi phối chiến lược hạ tầng của doanh nghiệp trong giai đoạn AI bùng nổ, khi agentic AI làm lượng token tiêu thụ tăng vọt và kéo theo áp lực lớn lên bài toán chi phí.
Tại Dell Technologies World 2026 (DTW 2026) diễn ra ở Las Vegas, Mỹ, ngày 19/5 theo giờ địa phương, hãng đã công bố định hướng hạ tầng dành cho các doanh nghiệp AI-native. Theo Dell, vấn đề hiện nay không còn chỉ là triển khai AI, mà là xác định tác vụ nào nên chạy trên mô hình nào và trên loại hạ tầng nào để đạt hiệu quả chi phí tốt nhất.
Chi phí token leo thang: doanh nghiệp phải thiết kế lại hạ tầng
Trong phần trình bày, Jeff Clarke, Phó chủ tịch kiêm Giám đốc vận hành (COO) của Dell Technologies, đã điểm lại những thay đổi của thị trường AI trong một năm qua. Ông cho biết khi các AI agent ngày càng trực tiếp tham gia xử lý công việc, chi phí token đang trở thành mối quan tâm lớn của doanh nghiệp.
Theo Clarke, giá đơn vị của mô hình AI có thể giảm, nhưng phạm vi ứng dụng AI ngày càng mở rộng khiến tổng lượng token tiêu thụ tăng theo cấp số nhân. Từ đó, “tokenomics” nổi lên như một biến số mới, phản ánh việc số lượng token phát sinh trong quá trình sử dụng AI có thể quyết định cấu trúc chi phí.
Ông cho rằng với các nhà cung cấp mô hình AI, trọng tâm là chi phí trên mỗi token và hiệu suất mô hình. Trong khi đó, với doanh nghiệp triển khai AI, vấn đề cốt lõi là kiểm soát lượng token ở cả đầu vào lẫn đầu ra.
Clarke so sánh xu hướng này với những gì từng diễn ra trên thị trường lưu trữ và điện toán. Theo ông, khi chi phí trên mỗi đơn vị giảm xuống, khối lượng sử dụng thường tăng mạnh, kéo tổng chi tiêu đi lên. “Khi giá mỗi dịch vụ hoặc thiết bị giảm, nhu cầu sử dụng mới sẽ bùng nổ. Chúng tôi đã chứng kiến mô hình này trong lĩnh vực lưu trữ và điện toán suốt nhiều thập kỷ”, ông nói.
Dell cũng nêu ví dụ một lập trình viên có thể sử dụng 10 AI agent và tiêu thụ tới 1 tỷ token chỉ trong một ngày. Ở quy mô doanh nghiệp, một số nhóm kỹ sư thậm chí có thể dùng hết hạn mức AI của cả tháng trong thời gian ngắn. Theo Clarke, đây không phải lỗi hệ thống, mà là hệ quả của việc AI agent đang được đưa vào công việc thực tế ngày càng hiệu quả.
Từ đó, Dell khuyến nghị doanh nghiệp không nên dồn toàn bộ tác vụ AI vào một mô hình hiệu năng cao duy nhất. Thay vào đó, cần phân loại theo tính chất công việc, mức độ nhạy cảm của dữ liệu, yêu cầu hiệu năng và cấu trúc chi phí để phân bổ phù hợp giữa máy trạm nội bộ, trung tâm dữ liệu tại chỗ, edge và đám mây.
“Vấn đề không phải token có tăng hay không, mà là doanh nghiệp có đang chạy đúng workload trên đúng hạ tầng hay không”, Clarke nói.
Một hướng tiếp cận được Dell nhấn mạnh là “token routing” - tức phân luồng tác vụ theo mô hình và hạ tầng phù hợp với từng nhu cầu cụ thể. Chẳng hạn, các tác vụ tóm tắt thông thường có thể dùng mô hình nhỏ, trong khi các phân tích tài chính nhạy cảm nên được xử lý trên hạ tầng nội bộ.
Theo Dell, cách tiếp cận này không chỉ giúp giảm chi phí mà còn hỗ trợ bảo vệ dữ liệu cá nhân và đáp ứng yêu cầu tuân thủ. Clarke cho biết token routing cùng bài toán quản trị token sẽ trở thành một trong những quyết định hạ tầng quan trọng nhất trong giai đoạn tới.
Dữ liệu sạch sẽ: quyết định hiệu quả token
Dell cũng nhấn mạnh rằng hạ tầng dữ liệu là nền tảng để giảm chi phí token. Nếu dữ liệu doanh nghiệp chưa được sắp xếp và làm sạch, hệ thống AI có thể tiêu tốn nhiều token hơn nhưng vẫn không tạo ra kết quả như kỳ vọng. Ngược lại, dữ liệu được chuẩn hóa tốt có thể giúp doanh nghiệp đạt cùng kết quả với mô hình nhỏ hơn và ít token hơn.
Theo Dell, “Dell AI Data Platform” có thể là một lời giải cho bài toán này. Arthur Lewis, Chủ tịch phụ trách Infrastructure Solutions Group của Dell Technologies, cho rằng nền tảng này có thể trở thành lớp hạ tầng giúp cải thiện hiệu quả sử dụng token.
Cụ thể, Dell AI Data Platform được thiết kế để chuẩn hóa dữ liệu phân tán trong doanh nghiệp thành định dạng mà AI có thể khai thác, đồng thời kết nối với các tác vụ suy luận AI. Nền tảng này cũng xử lý dữ liệu phi cấu trúc như hình ảnh, video và âm thanh, rồi chuyển chúng thành bộ dữ liệu để mô hình AI có thể sử dụng.
Bên cạnh đó, Lewis đề xuất doanh nghiệp xây dựng hạ tầng AI full-stack thông qua chiến lược Dell AI Factory và giải pháp AI Workstation. Tại DTW 2026, Dell cũng giới thiệu thêm nhiều giải pháp khác trong các mảng lưu trữ, máy chủ, bảo mật và tự động hóa.
“Hạ tầng dữ liệu tốt là điểm khởi đầu để nâng hiệu năng AI và cải thiện hiệu quả token. Doanh nghiệp cần chuẩn bị dữ liệu ở định dạng AI có thể sử dụng, đồng thời bảo đảm chúng được vận hành trên hạ tầng phù hợp nhất”, Lewis nói.