Sovereign AI đang nổi lên như động lực tăng trưởng mới của thị trường chip AI, khi nhu cầu không còn tập trung vào riêng nhóm hyperscaler mà mở rộng sang khu vực công và các dự án hạ tầng cấp quốc gia. Cùng với sự dịch chuyển đó, cấu trúc nhu cầu cũng thay đổi, từ mô hình phụ thuộc chủ yếu vào GPU sang hệ full-stack gồm CPU, bộ nhớ và công nghệ đóng gói.
Sovereign AI được hiểu là năng lực để một quốc gia hoặc tổ chức tự chủ trong việc xây dựng, vận hành và kiểm soát AI theo khuôn khổ pháp lý và quy định của riêng mình. Trong bối cảnh các quy định như Luật AI của Liên minh châu Âu (EU) và phạm vi áp dụng ngoài lãnh thổ của Đạo luật CLOUD của Mỹ làm gia tăng rủi ro phụ thuộc vào các hyperscaler Mỹ, nhiều quốc gia đang đẩy nhanh kế hoạch xây dựng hạ tầng AI riêng.
Xu hướng này cũng được nhấn mạnh tại hội nghị GPU Technology Conference (GTC) hồi tháng 3, khi CEO Jensen Huang của Nvidia cho rằng các quốc gia cần trực tiếp sở hữu trung tâm dữ liệu của mình.
Tốc độ chuyển dịch còn được đẩy nhanh hơn bởi sự lan rộng của agentic AI. Trong các hệ thống này, GPU đảm nhiệm quá trình sinh token, nhưng việc lập lịch token, điều phối tác vụ và quản trị dịch vụ vận hành 24/7 lại chủ yếu do CPU xử lý. Khi công bố AGI CPU, CEO Rene Haas của Arm cho biết nhu cầu CPU trong môi trường agentic AI có thể tăng gấp 4 lần, và đây vẫn là ước tính thận trọng. Ở quy mô quốc gia, Sovereign AI được xem là yếu tố tiếp tục khuếch đại xu hướng này.
Dữ liệu thị trường cũng cho thấy quy mô đáng kể của mảng này. Theo Kyobo Securities, doanh thu từ Sovereign AI của Nvidia trong năm tài chính 2026 (FY2026) tăng hơn 3 lần so với cùng kỳ, vượt 30 tỷ USD. Hãng nghiên cứu Gartner dự báo thị trường AI cloud sẽ đạt 267 tỷ USD vào năm 2030, trong đó các mô hình neo-cloud phục vụ sovereign chiếm khoảng 20%. Một số phân tích cũng cho rằng để xây dựng một AI stack độc lập, mỗi quốc gia cần đầu tư tối thiểu 1% GDP cho hạ tầng.
Với ngành bán dẫn, điều đáng chú ý là nhu cầu từ nhóm khách hàng này khác đáng kể so với giai đoạn trước. Các môi trường sovereign chịu ràng buộc lớn về điện năng, làm mát và không gian triển khai. Vì vậy, ưu tiên đang dịch chuyển từ hiệu năng tuyệt đối sang hiệu quả điện năng, đồng thời từ một loại bộ tăng tốc đơn lẻ sang kiến trúc tích hợp giữa CPU, bộ nhớ và hệ thống.
Trong ngành, quan điểm cho rằng không nhất thiết phải xây dựng các hệ thống quy mô hyperscaler trị giá hàng nghìn tỷ won cũng ngày càng phổ biến. Thay vào đó, hạ tầng cần được thiết kế phù hợp với quy mô nhu cầu thực tế. Bên cạnh đó, sau làn sóng mô hình ngôn ngữ lớn (LLM), sự đa dạng của các mô hình như mô hình thị giác - ngôn ngữ (VLM) cũng thúc đẩy xu hướng vận hành các mô hình cỡ vừa ở edge, như trạm gốc và các điểm trung chuyển.
Nhu cầu tùy biến lan từ GPU sang CPU, bộ nhớ và đóng gói
Đây cũng là lý do Nvidia không chỉ tập trung vào GPU mà còn đẩy mạnh các dòng CPU do hãng tự phát triển như Vera Rubin. Arm cũng đã công bố AGI CPU, dòng CPU máy chủ do hãng tự thiết kế, qua đó gia nhập trực tiếp thị trường này. Công ty đặt mục tiêu thay thế kiến trúc x86 với thông điệp hiệu năng cao gấp đôi trong cùng mức tiêu thụ điện.
Mohamed, lãnh đạo Arm, cho biết khách hàng đã chủ động đề nghị công ty hỗ trợ vì các giải pháp hiện tại chưa đáp ứng đủ yêu cầu. Trong bối cảnh các hệ thống sovereign phải tối ưu mạnh về điện năng và làm mát, xu hướng Sovereign AI đang trở thành lực đẩy giúp Arm tăng tốc thâm nhập thị trường chip máy chủ.
Tại Hàn Quốc, đầu tư vào hạ tầng Sovereign AI cũng đang dần chuyển hóa trực tiếp thành nhu cầu chip. Theo Kyobo Securities, nước này đã lập ngân sách AI 9,9 nghìn tỷ won và trong giai đoạn 1 đã chi 1.400 tỷ won để bảo đảm 13.000 GPU. NHN Cloud, Naver Cloud và Kakao được chọn làm đơn vị triển khai. Trong đó, NHN Cloud dự báo có thể thu về khoảng 300 tỷ won trong 5 năm từ phần công suất cung cấp ra bên ngoài cho khu vực tư nhân.
Giai đoạn 2 có quy mô khoảng 2.805 tỷ won, tập trung vào việc mua bổ sung các GPU thế hệ mới thuộc dòng Blackwell - Vera Rubin và xây dựng hệ thống GPUaaS vận hành thường trực. Cùng với việc mua GPU, nhu cầu đối với CPU máy chủ, bộ nhớ và công nghệ đóng gói cũng được dự báo tăng theo.
Gartner dự báo đến năm 2030, hơn 75% doanh nghiệp tại châu Âu và Trung Đông sẽ chuyển workload sang các giải pháp trong nước. Điều đó cho thấy đây không phải nhu cầu chính sách ngắn hạn, mà là một dịch chuyển mang tính cấu trúc. Với ngành chip, xu hướng này đồng thời mở ra cơ hội đa dạng hóa tệp khách hàng và mở rộng danh mục sản phẩm.
Nếu nhu cầu Sovereign AI tăng lên quy mô tương đương hyperscaler, thị trường chip AI sẽ không còn vận hành quanh một trục duy nhất là GPU, mà chuyển sang cấu trúc đa trục gồm CPU, bộ nhớ và đóng gói. Khi nhu cầu trở nên đa dạng hơn theo từng mô hình Sovereign AI, yếu tố quyết định cuối cùng sẽ là khả năng tích hợp giữa chip và hệ thống.