Bo mạch dùng chip RNGD của FuriosaAI. Ảnh: FuriosaAI

FuriosaAI ngày 28/5 cho biết đã ký thỏa thuận đối tác chiến lược với Broadcom để cùng phát triển bộ tăng tốc AI thế hệ tiếp theo và nền tảng suy luận AI mới, nhắm tới nhu cầu xử lý token trong các môi trường AI hyperscale toàn cầu.

Theo thỏa thuận, hai bên sẽ phát triển kiến trúc chip độc quyền Tensor Contraction Processor (TCP) của FuriosaAI theo hướng hệ thống chiplet đa-die. Mục tiêu là xây dựng nền tảng suy luận AI thế hệ mới có khả năng đáp ứng khối lượng xử lý ngày càng lớn trong các cụm AI quy mô lớn.

Phạm vi hợp tác không dừng ở đồng phát triển bán dẫn. FuriosaAI và Broadcom đặt mục tiêu xây dựng một nền tảng hạ tầng tích hợp giữa năng lực tính toán AI, kết nối mạng và phần mềm. Trong đó, công nghệ kiến trúc AI của FuriosaAI sẽ được kết hợp với công nghệ mạng AI và switch Ethernet băng thông cao của Broadcom để phục vụ các cụm suy luận AI quy mô lớn.

Nền tảng thế hệ mới sẽ được phát triển trên cơ sở RNGD (Renegade) - bộ tăng tốc AI thế hệ 2 của FuriosaAI. RNGD là bộ tăng tốc AI chuẩn PCIe với công suất 180W, sử dụng tiến trình 5nm của TSMC và bộ nhớ HBM3 của SK hynix, phục vụ các mô hình ngôn ngữ lớn (LLM) và tác vụ agentic AI.

Theo FuriosaAI, sản phẩm này đã hoàn tất quá trình kiểm chứng tại môi trường vận hành của các khách hàng như SamsungSDS và LG AI Research Institute. Công ty hiện triển khai sản phẩm cho khách hàng trong và ngoài nước, đồng thời mở rộng hệ sinh thái đối tác.

Đối với bộ tăng tốc AI thế hệ 3, FuriosaAI cho biết sản phẩm sẽ sử dụng die xử lý trên tiến trình 2nm cùng bộ nhớ HBM4/4E. Broadcom sẽ đảm nhiệm phần đóng gói tiên tiến để tích hợp nhiều die silicon vào một chip, đồng thời kết hợp công nghệ Ethernet và switch tốc độ cao nhằm hỗ trợ kết nối băng thông lớn ở cấp rack trong các cụm AI quy mô lớn. Hai bên đặt mục tiêu bắt đầu gửi mẫu thử của bộ tăng tốc thế hệ 3 trong nửa đầu năm 2028.

Ông Charlie Kawwas, Chủ tịch bộ phận Semiconductor Solutions của Broadcom, nhận định hiệu năng suy luận AI hiện không còn chỉ được quyết định bởi sức mạnh tính toán. Theo ông, khả năng tái sử dụng dữ liệu giữa các máy chủ và rack, cùng hiệu quả truyền thông, đang trở thành yếu tố cạnh tranh cốt lõi. Ông cho biết hai công ty sẽ kết hợp kiến trúc TCP của FuriosaAI với công nghệ XPU, nền tảng IP và công nghệ mạng Ethernet scale-up của Broadcom để giải quyết các điểm nghẽn chủ chốt trong môi trường agentic AI quy mô lớn.

Ông Baek Jun-ho, CEO FuriosaAI, cho rằng việc kết hợp năng lực hạ tầng của Broadcom với kiến trúc TCP và software stack của FuriosaAI sẽ giúp công ty cung cấp nền tảng suy luận AI hyperscale cho “kỷ nguyên Token Factory”. Ông nói sản phẩm thế hệ tiếp theo sẽ hướng tới mức hiệu năng trên mỗi watt thuộc nhóm dẫn đầu ngành, kể cả trong các môi trường mô hình AI siêu lớn và agentic AI hyperscale.

Từ khóa

#FuriosaAI #Broadcom #AI #bộ tăng tốc AI #chiplet #TCP #RNGD #TSMC #SK hynix #HBM
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.