Nvidia ngày 1/6 (giờ địa phương) công bố chiến lược đẩy mạnh hạ tầng cho kỷ nguyên AI tác nhân, đánh dấu bước chuyển trọng tâm từ AI tạo sinh sang các hệ thống AI có khả năng tự lập kế hoạch và thực thi công việc. Theo IT Home (Đài Loan), tại bài phát biểu khai mạc Computex, CEO Jensen Huang đã giới thiệu nền tảng thế hệ mới Vera Rubin, kiến trúc DSX dành cho AI factory và bộ công cụ phát triển agent cho doanh nghiệp.
Jensen Huang cho rằng kỷ nguyên AI ứng dụng thực tiễn đã bắt đầu, và AI đang chuyển từ một công nghệ tiêu tốn chi phí sang nền tảng tạo doanh thu. Theo ông, năng lực cạnh tranh của doanh nghiệp trong 10 năm tới sẽ phụ thuộc vào khả năng xây dựng, quản trị và vận hành hạ tầng AI.
Ông nhận định trong hai năm qua, ngành công nghệ đã dịch chuyển từ AI tạo sinh sang AI tác nhân. Theo đó, các ứng dụng doanh nghiệp sẽ không còn xoay quanh mã nguồn và hệ điều hành như trước, mà chuyển sang kiến trúc lấy mô hình ngôn ngữ lớn, framework agent, hệ thống bộ nhớ, công cụ và môi trường thực thi làm trung tâm.
Theo Nvidia, AI sẽ không còn chỉ dừng ở việc phản hồi câu hỏi, mà có thể hiểu ngữ cảnh, lập kế hoạch quy trình làm việc, đồng thời gọi công cụ và truy cập cơ sở dữ liệu để tạo ra và thực thi nhiều tác vụ liên quan đến mã nguồn, thiết kế CAD, tài liệu và quy trình nghiệp vụ.
Cùng với đó, công ty giới thiệu nền tảng phát triển agent cho doanh nghiệp, bao gồm mô hình mở Nemotron, môi trường thực thi Open Shell, framework agent, thư viện hàm CUDA-X và hệ thống bảo mật, quản trị. Mô hình mới Nemotron 3 Ultra kết hợp SSM với kiến trúc mixture-of-experts, cho tốc độ suy luận nhanh gấp 5 lần và giảm 30% chi phí so với thế hệ trước.
Nvidia cũng công bố bộ dữ liệu huấn luyện, kịch bản huấn luyện và chuỗi công cụ phát triển nhằm hỗ trợ doanh nghiệp tự xây dựng agent riêng.
Lấy ví dụ về ứng dụng thực tế, Nvidia cho biết chip design agent do hãng phát triển cùng Cadence có thể tự động hóa các khâu xác minh RTL, mô phỏng và gỡ lỗi. Theo công ty, quy trình vốn mất nhiều tuần có thể rút xuống còn vài giờ, đồng thời hiệu suất được cải thiện hơn 40 lần.
Ở mảng phần cứng, Nvidia cho biết nền tảng AI thế hệ mới Vera Rubin đã được đưa vào sản xuất hàng loạt. Nếu Hopper tập trung vào huấn luyện và Grace Blackwell hướng đến suy luận, Vera Rubin được phát triển để tối ưu cho AI tác nhân.
Nền tảng này tích hợp Vera CPU, Rubin GPU, NVLink 72, BlueField DPU, ConnectX-9 SuperNIC và hệ thống lưu trữ thế hệ mới.
Nvidia đồng thời mở rộng sang thị trường AI PC với Nvidia RTX Spark. Đây là chip được sản xuất trên tiến trình 3 nm của TSMC, kết hợp GPU Blackwell RTX với 6.144 nhân CUDA, CPU Grace 20 nhân và bộ nhớ hợp nhất 128 GB LPDDR5.
Công ty cũng cho biết đã hợp tác với Microsoft để xây dựng nền tảng Windows 11 dành cho agent, cho phép hệ điều hành khai thác trực tiếp GPU và các tài nguyên tăng tốc AI.
Bên cạnh đó, DSX được giới thiệu là kiến trúc tham chiếu kiêm hệ điều hành cho AI factory. Nền tảng này bao gồm các chức năng lập kế hoạch, mô phỏng, quản lý điện năng, làm mát bằng chất lỏng, tối ưu phân bổ GPU và kết nối với lưới điện.
Jensen Huang cho biết tại nhiều trung tâm dữ liệu AI, tới 40% công suất điện được phân bổ đang bị lãng phí. Theo ông, tỷ lệ sử dụng có thể được cải thiện thông qua phân bổ điện năng động, cân bằng phụ tải điện và điều khiển làm mát dựa trên agent.