Ảnh: Shutterstock

Theo SiliconAngle, ngày 17/3 theo giờ địa phương, Nvidia đã công bố Groq 3 LPU, dòng chip tăng tốc chuyên cho suy luận AI, tại hội nghị nhà phát triển GTC 2026. Sản phẩm được định vị cho các hệ thống AI đa tác nhân và đóng vai trò bổ sung cho GPU truyền thống.

Khác với GPU thông thường, Groq 3 LPU được tối ưu cho tác vụ suy luận của các mô hình AI. Nvidia cho biết con chip này tích hợp bộ nhớ tốc độ cao, đồng thời hướng đến độ trễ thấp khi xử lý khối lượng công việc AI đa tác nhân.

Theo hãng, Groq 3 LPU sẽ vận hành trên rack máy chủ chuyên dụng Groq 3 LPX, gồm 256 đơn vị xử lý và đạt băng thông 40 PB/s. Nvidia dự kiến kết hợp hệ thống này với rack Vera Rubin NVL72 sử dụng GPU Rubin, qua đó nâng thông lượng trên mỗi đơn vị điện năng lên gấp 35 lần và tăng khả năng sinh lời gấp 10 lần.

Bên cạnh Groq 3 LPX và Vera Rubin NVL72, Nvidia cũng giới thiệu thêm rack Vera CPU, rack lưu trữ BlueField-4 STX và rack mạng Spectrum-6 SPX.

Từ khóa

#Nvidia #GTC 2026 #Groq 3 LPU #chip suy luận AI #AI đa tác nhân #GPU #Vera Rubin NVL72 #BlueField-4 STX #Spectrum-6 SPX
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.