NHN Cloud ngày 26/5 công bố thương hiệu AI full-stack mới mang tên FactoryX, tích hợp hạ tầng, nền tảng và dịch vụ AI. Doanh nghiệp đồng thời đặt mục tiêu nâng tỷ trọng doanh thu từ AI lên 50% vào năm 2027.
Tại buổi họp báo tổ chức ở khách sạn The Plaza, quận Jung, Seoul, Tổng giám đốc Kim Dong-hoon cho biết cuộc cạnh tranh trong lĩnh vực AI đang chuyển dần từ việc phát triển mô hình quy mô lớn sang giai đoạn triển khai phục vụ hoạt động kinh doanh thực tế. Theo ông, NHN Cloud sẽ dựa trên 7 năm kinh nghiệm xây dựng và vận hành hạ tầng GPU để cung cấp dịch vụ full-stack với độ ổn định cao và chi phí tối ưu.
FactoryX được xây dựng theo ba lớp gồm hạ tầng, nền tảng và dịch vụ, cung cấp chuỗi năng lực từ bảo đảm nguồn cung GPU, tối ưu vận hành đến triển khai tác nhân AI.
Theo NHN Cloud, thị trường hạ tầng AI toàn cầu được dự báo đạt 939,4 tỷ USD vào năm 2030, với tốc độ tăng trưởng kép hằng năm trên 20%. Riêng tại Hàn Quốc, quy mô đầu tư cho hạ tầng AI trong năm nay ước khoảng 2.500 tỷ won.
Ở lớp hạ tầng, NHN Cloud tập trung vào cụm AI exascale phục vụ nhu cầu ứng dụng thực tế của doanh nghiệp. Trung tâm dữ liệu “FactoryX Seoul” mới đi vào hoạt động được triển khai với 7.656 GPU Nvidia Blackwell B200, đạt quy mô 27,4 exaflops, trong đó cụm đơn 4.080 GPU là cấu hình trọng tâm.
Ông Kang Min-soo, CIO phụ trách hạ tầng của NHN Cloud, cho biết riêng việc bảo đảm máy chủ GPU đã mất hơn 26 tuần, trong khi switch và cáp InfiniBand cần hơn 48 tuần. Tính cả thời gian lắp đặt, tổng thời gian triển khai dự án tối thiểu vượt 52 tuần. Ông cho biết năng lực GPU hiện tại của công ty gần như đã được khai thác hết công suất.
Công ty cũng nhấn mạnh lợi thế ở thiết kế làm mát khi lượng nhiệt phát sinh từ GPU tăng theo từng thế hệ. Theo NHN Cloud, GPU H100 tiêu thụ 700W, B200 là 1.200W, còn Rubin R100 vào khoảng 1.500W.
Để vận hành môi trường mật độ cao 75 kW mỗi rack, NHN Cloud áp dụng hệ thống làm mát bằng nước 100%. Công ty cho biết so với làm mát bằng gió, giải pháp này giúp giảm tỷ lệ sự cố GPU hằng năm xuống còn khoảng 1/3, đồng thời nâng thời gian hoạt động không lỗi trung bình từ 180.000 giờ lên 480.000 giờ. Tỷ lệ máy chủ AI sử dụng làm mát bằng nước cũng được dự báo tăng mạnh, từ 23% năm 2025 lên 57% trong năm nay.
Ở lớp nền tảng, NHN Cloud giới thiệu “GPU Live” - nền tảng quản trị GPU tích hợp do doanh nghiệp tự phát triển - nhằm giảm lãng phí tài nguyên và chi phí phát sinh từ GPU nhàn rỗi. Hệ thống có thể tự động tách khối lượng công việc huấn luyện và suy luận, đồng thời phân bổ tài nguyên linh hoạt theo nhu cầu.
Khi cần huấn luyện phân tán quy mô lớn, hệ thống có thể phân bổ cả cụm lớn. Ngược lại, với các tác vụ suy luận nhẹ, tài nguyên sẽ được chia nhỏ để tạo các endpoint phục vụ. GPU Live cũng hỗ trợ quản lý mức độ ưu tiên theo chính sách của từng tổ chức và giám sát tập trung theo thời gian thực.
Theo công bố của công ty, việc áp dụng GPU Live giúp giảm độ trễ cold start từ 75 giây xuống còn 1,2 giây, tương đương rút ngắn tối đa 61 lần. Hiệu suất sử dụng GPU cũng tăng trung bình hơn gấp đôi.
CTO Kim Tae-hyung cho biết một GPU H100 nếu ở trạng thái nhàn rỗi sẽ gây lãng phí 2,1 USD mỗi giờ. Với cụm 1.000 GPU chỉ được sử dụng 50% công suất, phần lãng phí có thể lên tới khoảng 9,2 triệu USD mỗi năm, tương đương gần 14 tỷ won. Theo ông, đặc tính khối lượng công việc giữa huấn luyện và suy luận là hoàn toàn khác nhau, trong khi kiến trúc hiện tại chủ yếu được tối ưu cho huấn luyện.
NHN Cloud cũng đang chuẩn bị cho giai đoạn nhu cầu suy luận gia tăng. Tổng giám đốc Kim Dong-hoon cho biết trước đây nhu cầu huấn luyện chiếm ưu thế nên dịch vụ của công ty tập trung vào mảng này. Ông dự báo thị trường NPU sẽ mở rộng từ năm tới, khi các mô hình thế hệ mới được triển khai mạnh hơn.
Hiện NHN Cloud đang vận hành dịch vụ dựa trên NPU nội địa tại Trung tâm Dữ liệu AI Quốc gia ở Gwangju với quy mô 11 petaflops.
Ở lớp dịch vụ, sản phẩm “Project X” dự kiến ra mắt trong nửa cuối năm nay. Đây là giải pháp cho phép doanh nghiệp thiết kế tác nhân AI theo nhu cầu bằng ngôn ngữ tự nhiên.
Ông Ahn Seong-min, Tổng giám đốc NHN Enterprise, cho biết dịch vụ này cung cấp môi trường đám mây để tác nhân AI có thể tự đưa ra quyết định, gọi công cụ và hoàn tất tác vụ mà không cần sự can thiệp trực tiếp của con người. Theo ông, cấu trúc này đồng thời giải quyết ba bài toán gồm bảo mật, khối lượng công việc của doanh nghiệp và chi phí.
Project X sẽ được cung cấp theo hai mô hình private và public. Với mô hình private, hệ thống được triển khai phù hợp với môi trường riêng của từng doanh nghiệp. Trong khi đó, mô hình public cho phép startup và người dùng cá nhân sử dụng cả mô hình thương mại lẫn mô hình nguồn mở trên môi trường tiêu chuẩn.
NHN Cloud đặt mục tiêu nâng tỷ trọng doanh thu từ AI từ 13% trong năm 2025 lên 38% vào năm 2026 và 50% vào năm 2027. Công ty hướng tới mức tăng trưởng doanh thu chung trên 24% mỗi năm; nếu tính cả phần mở rộng mảng GPU, mục tiêu tăng trưởng là trên 30%. Doanh nghiệp cũng cho biết kỳ vọng sẽ chuyển sang có lãi ngay trong năm nay.
NHN Cloud không tham gia dự án xây dựng GPU của chính phủ trong năm nay, nhưng đang chuẩn bị một trung tâm dữ liệu mới để hướng tới dự án vào năm sau. Tổng giám đốc Kim Dong-hoon giải thích dự án được triển khai từ năm ngoái đang vận hành hết công suất trong năm nay, vì vậy công ty ưu tiên tập trung vào khai thác.
Ông cũng cho biết năng lực hiện có của NHN Cloud vẫn lớn hơn quy mô triển khai mới trong năm nay, đồng thời dịch vụ cụm đơn 4.080 GPU sẽ tiếp tục giữ vị thế lớn nhất tại Hàn Quốc cho đến năm tới.
Theo NHN Cloud, tỷ lệ trúng thầu các dự án công của công ty hiện duy trì trên 60%. Tổng giám đốc Kim Dong-hoon nhận định thị trường AI hiện vẫn vận hành theo cấu trúc nhà nước dẫn dắt, còn khu vực tư nhân đảm nhiệm khai thác hạ tầng. Trong bối cảnh đó, cơ hội của từng doanh nghiệp sẽ phụ thuộc vào khả năng cung cấp dịch vụ nhanh, ổn định và nâng hiệu suất vận hành.
Ông nhấn mạnh rằng để doanh nghiệp trong nước duy trì chủ quyền dữ liệu và vận hành hoạt động kinh doanh AI, việc xây dựng một hệ sinh thái hạ tầng độc lập là điều bắt buộc. NHN Cloud đặt mục tiêu trở thành doanh nghiệp hạ tầng AI tiêu biểu, góp phần dẫn dắt nỗ lực vươn lên nhóm “AI G3”.