Nvidia đồng thời đẩy mạnh cuộc đua mô hình AI mở và mở rộng nguồn cung hạ tầng phần cứng. Ảnh chụp màn hình từ YouTube Nvidia

Nvidia vừa công bố mô hình AI mở cỡ lớn Nemotron 3 Ultra với 550 tỷ tham số, đồng thời cho biết nền tảng máy chủ AI thế hệ mới Vera Rubin đã bước vào giai đoạn sản xuất hàng loạt. Động thái cho thấy hãng đang tăng tốc chiến lược AI doanh nghiệp bằng cách phát triển song song cả mô hình lẫn hạ tầng trung tâm dữ liệu.

Theo Gizmodo Nhật Bản ngày 1/6 (giờ địa phương), CEO Nvidia Jensen Huang đã giới thiệu Nemotron 3 Ultra và Vera Rubin trong bài phát biểu khai mạc sự kiện Nvidia GTC Taipei 2026.

Nemotron 3 Ultra là mô hình ngôn ngữ lớn (LLM) với quy mô 550 tỷ tham số. Nvidia cho biết mô hình sẽ được phát hành dưới dạng mã nguồn mở và dự kiến ra mắt trong tuần này.

Nvidia mô tả Nemotron 3 Ultra là một trong những mô hình mở có hiệu năng cao nhất do doanh nghiệp Mỹ phát triển. Theo tài liệu hãng công bố, mô hình này cho thấy năng lực cạnh tranh trong nhiều bài kiểm thử benchmark khi đặt cạnh các mô hình mở quy mô lớn của Trung Quốc như GLM 5.1, Kimi K2.6 và Qwen 3.5. Công ty cũng nhấn mạnh lợi thế về hiệu quả chi phí của Nemotron 3 Ultra so với các đối thủ Trung Quốc.

Dù vậy, các đánh giá bên ngoài cho thấy Nemotron 3 Ultra vẫn còn khoảng cách với nhóm mô hình dẫn đầu từ Trung Quốc. Trên chỉ số AAI do tổ chức đánh giá AI Artificial Analysis công bố, mô hình của Nvidia đạt 48 điểm, cao hơn đáng kể mức 39 điểm của Gemma 4 31B từ Google nhưng vẫn thấp hơn 54 điểm của Kimi K2.6.

Nvidia cho biết hãng không chỉ tập trung vào điểm benchmark. Theo công ty, Nemotron 3 Ultra có thông lượng token tạo ra mỗi giây cao hơn so với các mô hình cạnh tranh có mức điểm đánh giá tương đương. Hãng xem đây là lợi thế về tốc độ xử lý và hiệu quả chi phí trong môi trường triển khai thực tế.

Một điểm nhấn khác tại sự kiện là việc Vera Rubin chính thức bước vào giai đoạn sản xuất hàng loạt. Đây là nền tảng máy chủ AI dành cho trung tâm dữ liệu, tích hợp GPU AI thế hệ mới Rubin, CPU Vera do Nvidia tự phát triển, cùng hệ thống lưu trữ và mạng hiệu năng cao.

Nvidia cho biết Vera Rubin mang lại hiệu suất xử lý cao hơn thế hệ trước trong môi trường agent AI. Khi ngành AI chuyển dần từ chatbot sang các agent AI có khả năng tự thực hiện tác vụ, nhu cầu đối với hạ tầng trung tâm dữ liệu liên quan cũng tăng nhanh.

Theo giới quan sát, thông báo lần này không đơn thuần là màn ra mắt riêng lẻ của một mô hình AI hay một nền tảng máy chủ. Đây được xem là bước đi cụ thể hóa chiến lược xây dựng hệ sinh thái bao phủ toàn bộ chuỗi giá trị, từ phát triển mô hình, suy luận đến cung cấp hạ tầng trung tâm dữ liệu.

Tại sự kiện, Jensen Huang cũng giới thiệu thêm các sản phẩm mới nhắm tới thị trường AI PC chạy Windows 11. Nổi bật trong số đó là hệ thống trên chip (SoC) cho laptop RTX Spark, kết hợp CPU trên nền tảng Arm với GPU Nvidia, cùng máy trạm AI hiệu năng cao DGX Station.

Dù vậy, tâm điểm chú ý của thị trường vẫn là Nemotron 3 Ultra và Vera Rubin. Trong bối cảnh cuộc đua mô hình mở ngày càng mở rộng thành cạnh tranh vị thế giữa các doanh nghiệp Mỹ và Trung Quốc, Nvidia đang tìm cách củng cố hiện diện bằng hiệu năng mô hình, tốc độ suy luận và hiệu quả chi phí.

Những điểm tiếp theo mà thị trường sẽ theo dõi là chính sách cấp phép và phạm vi sử dụng sau khi Nemotron 3 Ultra được phát hành, cũng như khả năng Vera Rubin đáp ứng nhu cầu từ thị trường AI doanh nghiệp và agent AI sau khi đi vào sản xuất hàng loạt.

Giới công nghiệp đánh giá động thái mới tiếp tục phản ánh chiến lược nhất quán của Nvidia: gắn kết phần mềm và phần cứng AI thành một hệ sinh thái thống nhất để mở rộng sức ảnh hưởng trên thị trường.

Từ khóa

#Nvidia #Nemotron 3 Ultra #Vera Rubin #AI #LLM #GPU #trung tâm dữ liệu #agent AI
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.