Jensen Huang, CEO của Nvidia, phát biểu tại APEC CEO Korea 2025 hồi năm ngoái. Ảnh: Nvidia

Nvidia đang tăng tốc chiến lược mở rộng hệ sinh thái AI tại Hàn Quốc khi liên tiếp phát hành miễn phí dữ liệu persona tiếng Hàn và bổ sung mô hình đa phương thức mới vào họ Nemotron. Động thái này được giới quan sát xem là bước triển khai cấu trúc “khóa” 4 lớp gồm mô hình, dữ liệu, framework và phần cứng, tương tự cách CUDA từng giúp Nvidia thống trị thị trường GPU.

Ngày 20/4, Nvidia công bố trên Hugging Face bộ dữ liệu Nemotron-Personas-Korea gồm 7 triệu persona tổng hợp bằng tiếng Hàn. Bộ dữ liệu được xây dựng dựa trên số liệu của Cổng thống kê quốc gia Hàn Quốc (KOSIS), Tòa án Tối cao, Cơ quan Bảo hiểm Y tế Quốc gia, Viện Kinh tế Nông thôn và Naver Cloud. Nvidia giới thiệu đây là bộ persona tiếng Hàn quy mô lớn đầu tiên. Dữ liệu được phát hành theo giấy phép CC BY 4.0, cho phép sử dụng cho mục đích thương mại.

Theo đánh giá của thị trường, việc mở miễn phí bộ dữ liệu tiếng Hàn có nhiều điểm tương đồng với chiến lược mà Nvidia từng áp dụng với CUDA. Khi đó, CUDA giúp hạ thấp rào cản gia nhập cho nhà phát triển và qua đó thu hẹp không gian của các lựa chọn thay thế ngoài GPU Nvidia. Với Nemotron, hãng đang áp dụng cách tiếp cận tương tự ở tầng mô hình, dữ liệu và framework, từ đó gia tăng lợi thế cho môi trường chạy tối ưu trên phần cứng của mình.

Việc công bố bộ persona này cũng được xem là tín hiệu cho thấy Nvidia bắt đầu triển khai rõ ràng hơn gói chiến lược 4 lớp tại Hàn Quốc. Nói về mục tiêu của hướng đi mã nguồn mở này, Brian Catanzaro, Phó chủ tịch phụ trách Nghiên cứu Ứng dụng của Nvidia, phát biểu trong bài giảng tại Đại học Quốc gia Seoul ngày 28/4 rằng: “Mỗi khi có điều tốt đẹp xảy ra trong lĩnh vực AI, đó là cơ hội để Nvidia tăng trưởng”.

Bước đầu tiên là mở rộng lớp mô hình. Nvidia cho biết sẽ ra mắt Nemotron3 Ultra với quy mô khoảng 500B tham số trong vài tuần tới, sau Nemotron3 Nano 30B và Nemotron3 Super 320B. Ngày 28/4, hãng cũng bổ sung Nemotron3 Nano Omni, một mô hình suy luận đa phương thức có thể xử lý văn bản, hình ảnh, âm thanh và video trong cùng một hệ thống. Theo Nvidia, Omni đạt thông lượng cao gấp 9 lần so với các mô hình omni mã nguồn mở cùng phân khúc.

Catanzaro cho biết Nemotron3 Super đã đứng đầu nhóm mô hình mở trên bài đánh giá MMLU Pro mà không cần tối ưu trước. Trong vòng một năm qua, tổng số lượt tải các mô hình thuộc họ Nemotron3 đã vượt 50 triệu.

Sau mô hình là lớp dữ liệu. Bộ 7 triệu persona tiếng Hàn được xem là phiên bản dành cho Hàn Quốc trong chuỗi dữ liệu tổng hợp mà Nvidia đang triển khai trên quy mô toàn cầu. Tại buổi giảng ở Đại học Quốc gia Seoul, Catanzaro nói các bộ dữ liệu tổng hợp như vậy “rất hữu ích” trong quá trình phát triển sản phẩm cho nhiều ngôn ngữ khác nhau, và Nvidia đã xác định cần xây dựng bộ dữ liệu tương tự cho Hàn Quốc.

Các thuộc tính như tên, giới tính, độ tuổi, tình trạng hôn nhân, trình độ học vấn, nghề nghiệp và khu vực cư trú được tổng hợp theo phân bố dân số thực tế của Hàn Quốc. Catanzaro cũng cho biết chỉ riêng việc tinh lọc dữ liệu tiền huấn luyện đã giúp hiệu quả huấn luyện trên cùng một cấu hình phần cứng cải thiện gấp 4 lần trong một năm.

Khi đã có mô hình mạnh và dữ liệu tinh vi, lớp tiếp theo là công cụ để khai thác chúng. Vai trò này thuộc về framework NeMo. Nvidia đã mở toàn bộ pipeline hậu huấn luyện, từ tinh chỉnh có giám sát, học tăng cường dựa trên mô hình thưởng, học tăng cường chuyên cho coding, học tăng cường từ phản hồi con người đến phương pháp lấy mẫu có loại bỏ. Hãng cũng công khai thuật toán Pivot RL giúp tăng tốc 5,5 lần cùng kỹ thuật chưng cất chính sách đa miền. Catanzaro nhấn mạnh rằng nếu có thể bắt đầu từ công nghệ mã nguồn mở rồi tiếp tục tùy biến, “giá trị lựa chọn” của nhà phát triển sẽ tăng lên.

Tuy nhiên, mắt xích cuối cùng là phần cứng lại không nằm trong phạm vi phát hành miễn phí. Catanzaro cho biết nếu Nvidia không hiểu sâu cấu trúc mạng nơ-ron, hãng đã không thể tạo ra Blackwell. NVLink 72, công nghệ được tích hợp trong thế hệ Blackwell, cho phép bộ nhớ của 72 GPU truy cập lẫn nhau và được thiết kế với giả định tối ưu cho các mô hình Mixture of Experts (MoE). Cấu trúc Latent MoE của Nemotron3 cũng được xây dựng trên tiền đề tận dụng NVLink 72. Ngay cả tiền huấn luyện 4-bit (FP4) cũng được thiết kế để phù hợp với đặc tính Tensor Core của Blackwell.

Điều đó đặt doanh nghiệp Hàn Quốc trước bài toán cân bằng giữa hiệu quả ngắn hạn và rủi ro phụ thuộc dài hạn.

Trên thực tế, nơi có thể vận hành hiệu quả nhất các mô hình, dữ liệu và framework mà Nvidia phát hành miễn phí vẫn là GPU của chính hãng. Mô hình “coalition” mà Catanzaro đề cập được hiểu là giai đoạn hướng tới hình thành tiêu chuẩn thực tế thông qua đồng phát triển với các tập đoàn lớn toàn cầu. Cách tiếp cận này khác với OpenAI hay Anthropic, những công ty chủ yếu thu doanh thu API thông qua mô hình đóng.

Cơ chế khóa như vậy cũng có thể xung đột với tiền đề của chính sách sovereign AI mà chính phủ Hàn Quốc đang thúc đẩy. Sovereign AI được hiểu là bảo đảm chủ quyền AI dựa trên ngôn ngữ, dữ liệu và hạ tầng trong nước. Tuy nhiên, khi một công ty GPU toàn cầu tổng hợp dữ liệu tiếng Hàn rồi phát hành miễn phí, trong khi môi trường huấn luyện và suy luận hiệu quả nhất lại gắn chặt với phần cứng của chính công ty đó, cấu trúc này có thể mâu thuẫn với chính định nghĩa về sovereign AI.

Sự tách biệt giữa “tính Hàn Quốc” của dữ liệu và “tính nước ngoài” của hạ tầng cũng làm thu hẹp lựa chọn của hệ sinh thái AI nội địa. Bộ persona tiếng Hàn là nguồn lực có thể đưa vào huấn luyện mô hình ngay lập tức. Nhưng khi mức độ phụ thuộc vào bộ dữ liệu này tăng dần, áp lực chuyển môi trường huấn luyện và suy luận sang framework NeMo cùng hệ GPU của Nvidia cũng sẽ lớn hơn.

Về dài hạn, các doanh nghiệp đang sở hữu mô hình nền tảng riêng như Naver, Kakao và LG AI Research sẽ phải lựa chọn giữa hiệu quả ngắn hạn khi tùy biến trên nền Nemotron và nguy cơ phụ thuộc dài hạn. Một đại diện trong ngành nhận định chính cấu trúc “doanh nghiệp nước ngoài tái cấu trúc dữ liệu Hàn Quốc rồi phân phối ngược trở lại thị trường nội địa” cho thấy cần xem xét lại cách xây dựng sovereign AI.

Từ khóa

#Nvidia #AI #CUDA #Nemotron #NeMo #GPU #Hàn Quốc #dữ liệu tổng hợp #đa phương thức #NVLink
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.