Nhà phân tích Patrick Moorhead. Ảnh: X của Patrick Moorhead

Ngày 16/3 (giờ địa phương), tại hội nghị thường niên GTC 2026, Nvidia công bố loạt sản phẩm mới xoay quanh nền tảng Vera Rubin, từ chip, rack đến phần mềm. Sau sự kiện, nhà phân tích công nghệ Patrick Moorhead nhận định Nvidia không còn chỉ là hãng chip AI, mà đang định vị lại thành nhà cung cấp nền tảng hạ tầng AI toàn diện.

Tâm điểm của đợt công bố là Vera Rubin, nền tảng hạ tầng AI mới của Nvidia. Theo Patrick Moorhead, đây là một trong những lần giới thiệu kiến trúc hoàn chỉnh nhất trong lịch sử GTC, với lộ trình thương mại hóa 7 dòng chip và 5 hệ thống rack.

Nổi bật trong hệ sinh thái này là rack NVL72, kết hợp GPU Rubin với CPU Vera thông qua NVLink 6, công nghệ kết nối tốc độ cao giữa các GPU. Nvidia cho biết Vera Rubin cho hiệu suất suy luận trên mỗi watt cao gấp 10 lần Blackwell, trong khi chi phí mỗi token giảm còn một phần mười. CEO Microsoft Satya Nadella cũng xác nhận Vera Rubin đã được triển khai trên Azure.

Một điểm khác thu hút sự chú ý là việc Nvidia tích hợp công nghệ từ Groq, công ty chuyên về chip suy luận AI. Rack Groq 3 LPX mà Nvidia giới thiệu được trang bị 256 bộ xử lý LPU, 128 GB SRAM trên chip và băng thông 640 terabyte/giây. Theo CEO của Nvidia Jensen Huang, khi kết hợp với Vera Rubin, hệ thống này có thể nâng thông lượng suy luận trên mỗi megawatt lên 35 lần. Samsung Electronics sẽ sản xuất chip LP30, với kế hoạch giao hàng vào nửa cuối năm 2026.

CPU Vera cũng là mảnh ghép đáng chú ý trong chiến lược mới của Nvidia. Jensen Huang cho biết ông không nghĩ nhu cầu dành cho CPU lại lớn đến vậy và tin rằng đây có thể trở thành mảng kinh doanh trị giá hàng tỷ USD.

Theo Nvidia, CPU Vera được thiết kế để phục vụ các tác vụ của AI agent, như gọi công cụ hoặc biên dịch mã. Đây đều là những khối lượng công việc chạy trên CPU; nếu CPU xử lý chậm, GPU sẽ phải chờ, làm giảm hiệu quả toàn hệ thống. Vera vì vậy được định vị là giải pháp tháo gỡ nút thắt này.

Alibaba, ByteDance, Meta và Oracle Cloud đã hợp tác triển khai CPU Vera, trong khi Dell, HPE, Lenovo và Supermicro phụ trách sản xuất hệ thống.

Bên cạnh phần cứng, Nvidia cũng cụ thể hóa rõ hơn chiến lược phần mềm. Công ty đã phát hành chính thức Dynamo 1.0, nền tảng suy luận mã nguồn mở dành cho “nhà máy AI”. Theo Nvidia, AWS, Microsoft, Google Cloud, Oracle Cloud cùng PayPal, Pinterest và ByteDance đã áp dụng nền tảng này.

Nvidia đồng thời giới thiệu NemoClaw Stack, bộ công cụ tăng cường bảo mật cho OpenClaw, nền tảng AI agent mã nguồn mở. Jensen Huang ví OpenClaw như Windows hay Mac, gọi đây là “hệ điều hành cho AI cá nhân” và cho rằng tầm quan trọng của nó có thể tương đương HTML và Linux. Ông cho biết Adobe, Atlassian, SAP, Salesforce, ServiceNow, CrowdStrike và Siemens đang triển khai nền tảng này.

Tốc độ mở rộng hệ sinh thái AI vật lý của Nvidia cũng được đánh giá cao hơn kỳ vọng. ABB, Fanuc, Kuka và Yaskawa cho biết đã ứng dụng Omniverse và Isaac Simulation của Nvidia trong mô phỏng và vận hành.

Tổng số robot mà bốn doanh nghiệp này đã triển khai vượt 2 triệu thiết bị. Trong lĩnh vực xe tự hành, BYD, Geely và Nissan sẽ sử dụng Nvidia DRIVE Hyperion cho xe tự lái cấp độ 4. Uber dự kiến từ năm 2027 sẽ mở rộng dịch vụ robotaxi dựa trên nền tảng Nvidia tới 28 thành phố.

Dù vậy, một số bài toán lớn vẫn chưa được giải quyết. Patrick Moorhead cho rằng việc vận hành đồng thời 5 loại rack, 7 dòng chip và nhiều chuẩn kết nối vẫn là thách thức quá phức tạp đối với phần lớn khách hàng doanh nghiệp, không chỉ riêng các hyperscaler.

Bài toán điện năng cũng tương tự. Theo ông, phần mềm cấp điện động DSX của Nvidia chỉ giúp tối ưu việc sử dụng điện, chứ không giải quyết được tình trạng thiếu nguồn cung. Ngoài ra, các chỉ số hiệu năng mà Nvidia công bố khi tích hợp Groq vẫn cần được kiểm chứng thêm trong môi trường triển khai thực tế tại khách hàng.

Từ khóa

#Nvidia #GTC 2026 #Vera Rubin #NVLink #Groq #Dynamo 1.0 #AI agent #Omniverse #DRIVE Hyperion
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.