Ảnh: Shutterstock

Thị trường CPU trung tâm dữ liệu, vốn lâu nay do Intel và AMD chi phối, đang bước vào giai đoạn cạnh tranh mới khi nhu cầu suy luận AI và AI agent tăng mạnh. Diễn biến này thúc đẩy hàng loạt công ty công nghệ, từ các nhà cung cấp đám mây lớn đến Nvidia, Arm và Alibaba, đẩy nhanh kế hoạch tự thiết kế CPU cho trung tâm dữ liệu.

Trước đó, AWS, Microsoft và Google Cloud đã lần lượt đưa các CPU trung tâm dữ liệu tự phát triển trên nền tảng kiến trúc Arm vào hạ tầng đám mây của mình. Gần đây, Nvidia và Arm cũng chính thức tham gia cuộc đua này. Trong khi đó, Alibaba công bố XuanTie C950, dòng CPU trung tâm dữ liệu phát triển trên kiến trúc mã nguồn mở RISC-V.

Theo giới chuyên môn, sự dịch chuyển nói trên đến từ việc khối lượng suy luận AI ngày càng chiếm tỷ trọng lớn hơn trong trung tâm dữ liệu. Nếu trước đây trọng tâm chủ yếu là huấn luyện mô hình, thì hiện nay CPU đang được đánh giá lại vai trò, thay vì chỉ GPU giữ vị trí trung tâm.

Tại sự kiện thường niên GTC 2026, Nvidia đã giới thiệu phiên bản beta của thế hệ CPU mới nhắm tới AI agent.

Theo Nvidia, Vera được phát triển để CPU giữ vai trò chủ đạo trong “AI factory”, thay vì chỉ đóng vai trò hỗ trợ. Con chip này sử dụng kiến trúc Arm và được hãng tuyên bố nhanh hơn 50%, đồng thời hiệu quả gấp đôi so với các CPU hiện nay trên nền tảng x86.

Nvidia từ lâu thống trị thị trường AI nhờ GPU. Tuy nhiên, khi agentic AI mở rộng nhanh và vai trò của CPU gia tăng, công ty đang tăng tốc mở rộng sang mảng CPU trung tâm dữ liệu.

Trong khi GPU phù hợp với huấn luyện và vận hành mô hình AI, CPU đảm nhiệm xử lý dữ liệu quy mô lớn và điều phối AI agent. Nvidia dự kiến triển khai Vera trước tiên ở quy mô lớn tại Meta.

Arm, công ty lâu nay tập trung vào mảng cung cấp IP cho các nhà phát triển chip, cũng tham gia cuộc đua với dòng CPU trung tâm dữ liệu mang tên “AGI CPU”.

Theo Arm, giải pháp này được thiết kế để phục vụ làn sóng AI mới. Công ty cho biết một rack làm mát bằng không khí có thể tích hợp tối đa 64 CPU với khoảng 8.700 lõi. Hiệu năng trên mỗi watt được hãng công bố cao gấp đôi so với rack x86, tức đạt gấp đôi hiệu năng trong cùng không gian và mức điện năng tiêu thụ. Arm kỳ vọng đây sẽ là lựa chọn hấp dẫn với các nhà vận hành trung tâm dữ liệu đang chịu áp lực về giới hạn điện năng.

Alibaba cũng cho biết XuanTie C950 được phát triển với trọng tâm hỗ trợ AI agent. Con chip này được tối ưu cho các tác vụ suy luận AI khi triển khai trong trung tâm dữ liệu.

Theo Alibaba, GPU là thành phần bắt buộc trong huấn luyện mô hình AI, trong khi CPU giữ vai trò quan trọng khi AI agent thực hiện các tác vụ nhiều bước.

Khác với Nvidia và nhiều hãng đám mây lớn chọn Arm, XuanTie C950 được phát triển trên kiến trúc RISC-V. Đây là kiến trúc mở có thể sử dụng miễn phí, được xem là một lựa chọn giúp giảm chi phí bản quyền so với Arm. Alibaba hiện đẩy mạnh phát triển chip AI thông qua đơn vị chip T-Head và gần đây cũng đã ra mắt chip AI Zhenyue 810E.

Từ khóa

#AI #AI agent #CPU trung tâm dữ liệu #Nvidia #Arm #Alibaba #RISC-V #AWS #Microsoft #Google Cloud
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.