Sovereign AI cần hạ tầng suy luận phân tán để mở lối cho NPU nội địa

Hàn Quốc đang đẩy mạnh đầu tư hạ tầng AI quy mô lớn với trọng tâm là GPU của Nvidia, nhưng ngày càng nhiều ý kiến cho rằng cách tiếp cận này chưa đủ để xây dựng một hệ sinh thái AI tự chủ. Theo các chuyên gia, chiến lược AI cần dịch chuyển sang mô hình suy luận phân tán, nơi dữ liệu được xử lý ngay tại địa phương, đồng thời mở ra thị trường thực tế cho NPU nội địa.

Tháng 10 năm ngoái, Nvidia công bố kế hoạch cung cấp 260.000 GPU cho Hàn Quốc. Động thái này được xem là một bước tiến quan trọng trong mục tiêu đưa nước này trở thành “một trong ba cường quốc AI”.

Tuy nhiên, phần lớn nguồn cung GPU lại tập trung vào các tập đoàn lớn. Trong đó, Samsung Electronics nhận 50.000 GPU để vận hành “AI factory” nội bộ, phục vụ tối ưu hiệu suất HBM và tỷ lệ thành phẩm mảng foundry. Hyundai nhận 50.000 GPU cho mô phỏng lái tự hành. SK được phân bổ 50.000 GPU cho AI factory, còn Naver Cloud nhận 60.000 GPU để làm nền tảng cho hoạt động kinh doanh đám mây.

Phần GPU có thể dành cho khối đại học, viện nghiên cứu và startup theo chính sách quốc gia chỉ vào khoảng 20% tổng số. Với gói ngân sách bổ sung trị giá 1.460 tỷ won, Hàn Quốc trước mắt bảo đảm được 13.136 GPU. Tuy nhiên, các đơn vị trực tiếp mua và vận hành lại là Naver Cloud, NHN Cloud và Kakao, trong khi phía chính phủ đi thuê lại năng lực tính toán.

Ngay cả phần phân bổ cho các trường đại học và viện nghiên cứu cũng chủ yếu ở dạng tài nguyên ảo hóa trong trung tâm dữ liệu của ba doanh nghiệp này. Mỗi đề tài chỉ được sử dụng tối đa 12 tháng, còn doanh nghiệp phải tự chi trả từ 5% đến 10% theo giá thị trường.

Các GPU H200 và B200 mà chính phủ bảo đảm được thuộc nhóm hiệu năng cao, phù hợp với huấn luyện mô hình lớn và các tác vụ tính toán AI quy mô lớn. H200 SXM có công suất tối đa 700W, trong khi B200 có thể đòi hỏi mức điện năng và làm mát còn cao hơn, tùy theo cấu hình hệ thống.

Đây là loại thiết bị phù hợp để ghép thành các cụm từ hàng trăm đến hàng nghìn GPU nhằm huấn luyện mô hình nền tảng. Nhu cầu về các cụm GPU lớn cho nghiên cứu cấp quốc gia là điều không thể phủ nhận. Tuy nhiên, không phải mọi nhu cầu AI đều có thể được giải quyết bằng cùng một mô hình hạ tầng.

Theo giới chuyên gia, trọng tâm của AI đang chuyển nhanh từ huấn luyện sang suy luận. Khi các tác vụ như AI tác nhân, AI theo ngành, AI vật lý hay AI giám sát theo khu vực tăng lên, nhu cầu cốt lõi không còn chỉ là năng lực huấn luyện cực lớn mà là suy luận độ trễ thấp, tiêu thụ điện thấp và vận hành gần nơi dữ liệu phát sinh.

Mô hình kéo toàn bộ dữ liệu từ bệnh viện, nhà máy, cảng biển, khu công nghiệp, trường học hay trung tâm điều hành giao thông về một điểm tập trung đang bộc lộ nhiều giới hạn. Trong nhiều trường hợp, hệ thống cần đưa ra quyết định và phản hồi ngay tại nơi dữ liệu được tạo ra.

Trên thị trường đã có các dòng chip chuyên cho suy luận. Tại Hàn Quốc, FuriosaAI và Rebellion cũng đã cung cấp NPU, trong khi các dự án triển khai thực tế đang tăng dần tại LG AI Research, KT Cloud và SK Datacenter.

Dù vậy, NPU nội địa vẫn thua kém GPU và NPU nước ngoài về hiệu năng, mức độ phổ dụng và hệ sinh thái phần mềm. Trải nghiệm cho nhà phát triển còn hạn chế, số lượng mô hình và framework được hỗ trợ cũng chưa nhiều.

Ở mảng huấn luyện quy mô lớn hoặc xử lý AI đa dụng, NPU nội địa hiện khó cạnh tranh trực diện. Vì vậy, thiết kế chính sách trở thành yếu tố quyết định. Nếu chỉ dựa vào bảo hộ hoặc đầu tư tài chính, các doanh nghiệp NPU trong nước khó tạo được năng lực cạnh tranh thật sự.

Theo giới chuyên gia, chip AI chỉ có thể trưởng thành khi phải đáp ứng khách hàng thật, bài toán thật, chi phí thật và các yêu cầu SLA cụ thể. Những nhu cầu như đọc ảnh y khoa, phát hiện bất thường trong nhà máy, phân tích CCTV của chính quyền địa phương, điều hành giao thông, tự động hóa xử lý kiến nghị hay xử lý dữ liệu học tập tại trường học mới là môi trường giúp chip, driver, compiler và hệ sinh thái phần mềm được hoàn thiện.

Trong bối cảnh đó, nếu chính phủ tiếp tục cung cấp GPU Nvidia với quy mô lớn và mức giá chỉ bằng 5-10% giá thị trường, startup gần như chắc chắn sẽ chọn phương án này. Khi đó, động lực thử nghiệm NPU nội địa còn chưa hoàn thiện sẽ suy giảm đáng kể.

Điều này cũng khiến các công ty phát triển NPU trong nước khó có đủ thời gian để tích lũy năng lực cạnh tranh thông qua thị trường thực tế.

Một ví dụ là dự án Trung tâm điện toán AI quốc gia tại Solarsido, Haenam, tỉnh Jeonnam. Đây là dự án có tổng vốn 2.406,5 tỷ won, đặt mục tiêu xây dựng theo từng giai đoạn với 15.000 GPU vào năm 2028 và 50.000 GPU vào năm 2030.

Tuy nhiên, sau hai lần đấu thầu bất thành, tỷ lệ sở hữu của khu vực công đã giảm từ 51% xuống dưới 30%. Đồng thời, điều khoản bắt buộc lắp đặt NPU nội địa cũng bị loại bỏ.

Theo cấu trúc hiện nay, dự án ngày càng mang màu sắc của một hạ tầng thương mại do liên danh các tập đoàn lớn dẫn dắt. Trong khi đó, ngân sách dành cho dự án micro data center chỉ ở mức 27,3 tỷ won.

So với các trung tâm dữ liệu quy mô hàng nghìn tỷ won, mức độ ưu tiên chính sách dành cho micro data center hiện thấp hơn đáng kể.

Chính phủ Hàn Quốc liên tục nhấn mạnh mục tiêu Sovereign AI. Tuy nhiên, với cấu trúc đầu tư hiện tại, khái niệm này có nguy cơ chỉ dừng ở việc đặt chip Nvidia trên lãnh thổ Hàn Quốc. Trong khi đó, chủ quyền dữ liệu thực sự lại nằm ở khả năng xử lý dữ liệu tại nơi nó được tạo ra.

Dữ liệu quy trình sản xuất tại địa phương, dữ liệu hình ảnh của cơ sở y tế, CCTV của chính quyền, dữ liệu học tập ở trường học hay dữ liệu thiết bị trong khu công nghiệp đều cần được xử lý ngay tại nguồn.

Một phương án được nêu ra là kết hợp tài sản công nhàn rỗi, hạ tầng mobility tiên tiến và các điểm suy luận phân tán. Hiện số trường học đóng cửa trên toàn quốc đã vượt 4.000, trong đó có hàng trăm cơ sở vẫn chưa được sử dụng.

Đến năm 2025, số khu công nghiệp cũ đã tăng lên khoảng 520. Nếu chọn lọc những địa điểm có khả năng tiếp cận điện, viễn thông và giao thông, đây có thể trở thành ứng viên phù hợp cho hạ tầng AI cấp vùng.

Các trường học bỏ hoang và khu công nghiệp cũ có lợi thế là có thể tận dụng đất công và một phần hạ tầng sẵn có, từ đó giảm chi phí tìm quỹ đất mới. Dù vẫn cần nâng cấp điện, làm mát và viễn thông theo chuẩn trung tâm dữ liệu, chi phí khởi điểm vẫn khác đáng kể so với việc xây mới hoàn toàn một trung tâm lớn.

Mô hình này cũng có thể kết hợp với vertiport của UAM. Vertiport không chỉ là điểm cất hạ cánh mà còn tạo ra nhu cầu AI độ trễ thấp cho các tác vụ như điều hành thời gian thực, tối ưu tuyến đường, tránh va chạm và phát hiện tiếp cận bất thường.

Nếu được thiết kế đồng thời, vertiport và các điểm suy luận phân tán có thể giúp xây dựng song song hạ tầng giao thông và hạ tầng AI. Ở cấp đô thị lớn, có thể triển khai các điểm 5-10MW tích hợp vertiport, trung tâm suy luận và khu colocate cho startup. Ở cấp quận, huyện, mô hình phù hợp có thể là các điểm 1-3MW tận dụng trường học bỏ hoang và đất công cũ. Ở cấp phường, các node container 100kW có thể đặt tại thư viện hoặc không gian phụ trợ của trụ sở hành chính.

Khi đó, hạ tầng hyperscale tập trung và các điểm suy luận tại địa phương có thể bổ trợ cho nhau thay vì cạnh tranh trực tiếp.

Nếu ưu tiên bố trí NPU nội địa tại các điểm suy luận phân tán, hai thị trường có thể được mở ra cùng lúc. Một mặt, địa phương có thể xử lý dữ liệu ngay tại chỗ. Mặt khác, doanh nghiệp bán dẫn AI trong nước có được nhu cầu thực để hoàn thiện sản phẩm.

Theo các chuyên gia, nếu loại NPU nội địa khỏi thị trường chỉ vì còn thiếu hiệu năng, khoảng cách này sẽ kéo dài mãi. Nhưng nếu áp đặt việc sử dụng công nghệ chưa được kiểm chứng, rủi ro sẽ dồn về phía đơn vị vận hành. Giải pháp hợp lý nằm ở khoảng giữa: xem các điểm suy luận địa phương là nơi kiểm chứng thực tế cho NPU nội địa.

Ở giai đoạn đầu, có thể triển khai song song GPU và NPU, đồng thời công khai so sánh hiệu năng, điện năng và chi phí theo từng tác vụ. Những phần việc NPU làm tốt nên được giao trước, còn các điểm yếu cần được cải thiện nhanh dựa trên dữ liệu vận hành thực tế.

Một trở ngại lớn là mô hình này liên quan đồng thời đến nhiều bộ ngành. Trường học bỏ hoang thuộc phạm vi của Bộ Giáo dục và cơ quan giáo dục địa phương; khu công nghiệp cũ thuộc Bộ Công nghiệp; vertiport do Bộ Đất đai - Hạ tầng quản lý; trung tâm dữ liệu thuộc Bộ Khoa học và ICT; còn bài toán phát triển cân bằng vùng miền liên quan đến Bộ Nội vụ. Với cấu trúc hành chính như vậy, các dự án liên bộ thường khó được triển khai nhanh.

Đây cũng là một trong những lý do khiến ngân sách micro data center chỉ còn 27,3 tỷ won. Với nguồn nhân lực hạn chế của Bộ Khoa học và ICT, chính phủ trung ương khó có thể cùng lúc quy hoạch và triển khai hạ tầng phân tán tại hàng chục địa phương.

Chính phủ có thể đưa ra định hướng lớn và bố trí ngân sách, nhưng việc kết nối quỹ đất địa phương, hạ tầng điện, giấy phép và nhu cầu công nghiệp lại vượt quá khả năng điều hành trực tiếp của trung ương.

Vì vậy, vai trò của các ứng viên trong cuộc bầu cử địa phương ngày 3/6 trở nên đặc biệt quan trọng. Nhiệm kỳ chính quyền địa phương tới không nên chỉ dừng ở việc công bố cam kết, mà cần chủ động kết nối tài sản nhàn rỗi với nhu cầu công nghiệp tại địa bàn mình, sau đó đề xuất ngược lại lên trung ương.

Lý do là chính quyền địa phương nắm trong tay những thẩm quyền mà trung ương không thể thay thế. Trước hết là quyền sở hữu và quản lý tài sản nhàn rỗi. Việc khai thác trường học bỏ hoang cần sự phối hợp giữa cơ quan giáo dục và lãnh đạo địa phương, trong khi quỹ đất tái thiết khu công nghiệp cũ, thư viện công hay không gian phụ trợ của trụ sở hành chính cũng cần địa phương chủ động đứng ra tổ chức.

Thứ hai là khả năng tích hợp nhu cầu. Chỉ chính quyền địa phương mới có thể gộp dữ liệu từ bệnh viện, trường học, khu công nghiệp, hệ thống điều hành giao thông và dữ liệu hành chính để hình thành một nhu cầu AI đủ lớn.

Nhu cầu đủ lớn mới có thể kéo theo hạ tầng, và hạ tầng mới có thể thu hút doanh nghiệp. Thứ ba là tính chính danh khi lập liên danh. Chỉ khi một SPV quy tụ chính quyền địa phương, trường đại học trong vùng, bệnh viện địa phương, khu công nghiệp, nhà cung cấp colocate tư nhân và doanh nghiệp NPU nội địa cùng tham gia đấu thầu các gói hỗ trợ từ trung ương, dự án mới có hình hài rõ ràng.

Một số phân tích cũng cho thấy trung tâm dữ liệu thương mại hiện tập trung rất mạnh tại Seoul và vùng thủ đô. Dù xét theo số lượng trung tâm dữ liệu hay nhu cầu điện năng, sự lệch pha giữa khu vực thủ đô và các địa phương vẫn rất rõ.

Trong thời gian qua, địa phương chủ yếu được đặt trong diễn ngôn phát triển cân bằng vùng miền. Nhưng ở nhiệm kỳ tới, vai trò này có thể thay đổi nếu xuất hiện những lãnh đạo địa phương trực tiếp thiết kế được “gói hạ tầng AI phân tán”, kết nối đất trường học bỏ hoang, kế hoạch tái thiết khu công nghiệp cũ, vị trí vertiport tiềm năng cùng dữ liệu y tế và sản xuất của địa phương.

Chính ở cấp chính quyền này mới có đủ thẩm quyền để kết hợp đồng thời quỹ đất, điện, giấy phép và nhu cầu công nghiệp.

Theo giới chuyên gia, việc giải quyết toàn bộ nhu cầu AI chỉ bằng các cụm GPU quy mô lớn là không thực tế. NPU nội địa còn thiếu là sự thật, nhưng nếu bị loại khỏi thị trường thực tế chỉ vì chưa hoàn thiện, công nghệ này sẽ khó có cơ hội bắt kịp.

Khoảng cách công nghệ không thể thu hẹp chỉ trong phòng thí nghiệm. Nó chỉ giảm xuống khi sản phẩm tiếp xúc với khách hàng, trải qua sự cố vận hành, tối ưu chi phí, chứng minh hiệu quả điện năng và xây dựng được hệ sinh thái đủ thân thiện với nhà phát triển.

Hạ tầng hyperscale tập trung vẫn rất cần thiết, và các cụm GPU lớn vẫn phải tồn tại để phục vụ huấn luyện mô hình lớn cũng như nghiên cứu cấp quốc gia. Tuy nhiên, chỉ như vậy là chưa đủ để nuôi lớn toàn bộ ngành công nghiệp AI.

Điều cần thiết là triển khai các điểm suy luận theo từng địa phương và tạo ra một môi trường thử nghiệm thực tế cho NPU nội địa. GPU và NPU nên được bố trí song song, so sánh hiệu năng, điện năng và chi phí theo từng tác vụ, đồng thời mở thị trường ban đầu thông qua nhu cầu công.

Theo bài toán này, những người có quyền lực gần nhất để biến bức tranh đó thành hiện thực chính là các lãnh đạo chính quyền địa phương trong nhiệm kỳ tới.

Hyun-chul Kim delight@d-today.co.kr

Từ khóa