Google đang đàm phán với Marvell Technology để cùng phát triển hai dòng chip mới phục vụ AI, gồm một TPU chuyên cho suy luận và một chip xử lý bộ nhớ đi kèm. Thông tin do The Information đăng vào ngày 19/4 (giờ địa phương), dẫn lời hai nguồn tin am hiểu vấn đề.
Theo nguồn tin, một trong hai con chip là bộ xử lý bộ nhớ hoạt động cùng TPU của Google, còn chip còn lại là TPU mới được thiết kế riêng cho các tác vụ suy luận AI. Chip xử lý bộ nhớ này sẽ phối hợp với TPU để phân tách tác vụ theo yêu cầu tính toán và bộ nhớ, qua đó nâng hiệu quả xử lý.
The Information cho biết động thái của Google phản ánh nhu cầu chip suy luận đang tăng mạnh, trong bối cảnh các sản phẩm AI như AI agent ngày càng được triển khai rộng rãi.
Trước đó, tại hội nghị GTC diễn ra vào tháng 3, Nvidia đã công bố LPU nhằm cải thiện hiệu quả cho các tác vụ suy luận. LPU của Nvidia dựa trên công nghệ của Groq, công ty mà Nvidia đã ký thỏa thuận cấp phép trị giá 20 tỷ USD. Theo The Information, Google vốn đã có kế hoạch phát triển chip suy luận mới, nhưng đang đẩy nhanh tiến độ sau khi Nvidia ra mắt LPU. Marvell cũng là đối tác thiết kế LPU thế hệ đầu của Groq và đã có kinh nghiệm trong mảng chip suy luận.
Google từ lâu đã mua sản phẩm của Marvell, song các cuộc thảo luận lần này hướng tới một thiết kế tùy biến riêng cho Google. The Information nhận định đây là bước đi tiếp theo trong nỗ lực giảm phụ thuộc vào Broadcom, đối tác lâu năm của Google trong thiết kế TPU.
Google và Marvell đặt mục tiêu hoàn tất thiết kế sớm nhất vào năm tới, trước khi chuyển sang giai đoạn sản xuất thử nghiệm.