Làn sóng triển khai AI đang buộc doanh nghiệp điều chỉnh lại chiến lược trung tâm dữ liệu. Dell Technologies cho rằng khối lượng công việc AI sẽ không chỉ chạy trên đám mây công cộng, mà còn dịch chuyển mạnh về trung tâm dữ liệu nội bộ, edge và cả các hệ thống desk-side. Theo hãng, triển khai AI sát nơi dữ liệu được lưu trữ sẽ giúp giảm chi phí token và hạn chế gánh nặng dịch chuyển dữ liệu.
Ngày 20/5 (giờ địa phương), tại sự kiện Dell Technologies World 2026 ở Las Vegas, Varun Chhabra, Phó chủ tịch cấp cao Dell Technologies, cho biết vị trí lưu trữ dữ liệu và chi phí token sẽ là hai biến số quan trọng trong chiến lược hạ tầng AI thời gian tới.
◆ Chi phí token thành biến số mới của hạ tầng AI
Theo ông Chhabra, làn sóng agentic AI có thể thúc đẩy nhu cầu triển khai AI on-premises. Các mô hình được vận hành trong môi trường riêng cũng giúp rút ngắn đường đi của dữ liệu, qua đó kéo giảm chi phí token.
Ông cho biết khi số lượng agent tăng lên, lượng token tiêu thụ cũng tăng theo. Trong khi đó, phần lớn dịch vụ đám mây công cộng và API của các nhà cung cấp AI hiện đều thu phí theo token, khiến chi phí có thể tăng rất nhanh.
Theo ông, đầu tư vào hệ thống desk-side hoặc máy chủ nội bộ cũng tương tự sở hữu một “cỗ máy tạo token”. Khi AI được chạy on-premises hoặc trên các thiết bị đặt tại chỗ, doanh nghiệp không còn phải liên tục trả phí theo token như trên đám mây, nhờ đó hiệu quả kinh tế có thể tốt hơn.
Dell hiện tiếp tục mở rộng danh mục AI Factory hợp tác với Nvidia. Tại sự kiện lần này, hãng giới thiệu Dell Desk-side Agentic AI, giải pháp cho phép doanh nghiệp xây dựng và vận hành các agent AI tự trị trong môi trường nội bộ. Theo Dell, mô hình này giúp doanh nghiệp triển khai agent AI an toàn mà không cần đưa dữ liệu ra ngoài, đồng thời biến khoản chi token biến động trên đám mây thành đầu tư hạ tầng có khả năng dự báo cao hơn.
Ông Chhabra cũng nhấn mạnh xu hướng đưa các mô hình frontier vào hạ tầng nội bộ. Ông cho biết trước đây những mô hình như Gemini, Grok hay OpenAI chủ yếu chỉ có thể sử dụng trên đám mây, nhưng hiện đã có thể được triển khai trong môi trường on-premises dựa trên máy chủ của Dell.
◆ Dell đặt cược vào đám mây riêng phân tán
Với chiến lược đám mây riêng, Dell đang đặt trọng tâm vào yếu tố phân tán. Caitlin Gordon, Phó chủ tịch Dell, cho rằng đám mây riêng phân tán sẽ là kiến trúc đám mây thế hệ tiếp theo.
Theo bà Gordon, dù ứng dụng AI đang tăng tốc, phần lớn dữ liệu của doanh nghiệp vẫn được lưu trữ trong chính trung tâm dữ liệu của họ. Vì vậy, Dell tin rằng hạ tầng phân tán sẽ là lựa chọn phù hợp hơn cho khách hàng trong tương lai.
Dell Private Cloud kết hợp sự đơn giản trong vận hành của hạ tầng siêu hội tụ (HCI) với hiệu quả và khả năng mở rộng của kiến trúc ba lớp truyền thống. Nền tảng này cho phép mở rộng độc lập các lớp tính toán, lưu trữ, mạng và ảo hóa, giúp doanh nghiệp tăng tài nguyên đúng theo nhu cầu ở từng lớp.
Dell cũng cho rằng lợi thế về chi phí của mô hình này sẽ khá rõ rệt. Trong kiến trúc HCI, các nút tính toán phải đồng thời gánh khối lượng công việc của ứng dụng và lưu trữ, nên cần nhiều bộ nhớ và ổ đĩa hơn. Ngược lại, với hạ tầng phân tán, lớp tính toán có thể tập trung cho ứng dụng, qua đó giảm số lượng nút, số lõi và cả chi phí bản quyền hypervisor. Theo bà Gordon, so với HCI, mô hình hạ tầng phân tán có thể giúp nâng hiệu quả chi phí lên tới 65%.
Đây cũng là hướng đi Dell nhắm tới trong bối cảnh nhiều doanh nghiệp đang rà soát lại chiến lược hypervisor sau thương vụ Broadcom thâu tóm VMware. Bà Gordon cho biết Dell Private Cloud được thiết kế để hỗ trợ khách hàng vừa duy trì hypervisor hiện tại, vừa có nền tảng tiết kiệm chi phí hơn để từng bước chuyển sang lựa chọn khác trong tương lai.