Arm AGI CPU dành cho trung tâm dữ liệu AI. Ảnh: Arm

Arm ngày 25/3 công bố Arm AGI CPU, dòng CPU cho trung tâm dữ liệu phục vụ hạ tầng agentic AI. Đây là lần đầu tiên trong 34 năm hoạt động, Arm trực tiếp đưa ra thị trường một sản phẩm silicon của riêng mình, thay vì chỉ tập trung vào mô hình cấp phép IP như trước. Động thái này phản ánh nhu cầu CPU tăng mạnh trong làn sóng AI mới, đồng thời mở rộng quan hệ hợp tác của Arm với các đối tác bán dẫn như Samsung Electronics và SK hynix.

Arm AGI CPU được phát triển trên kiến trúc Arm Neoverse V3, tích hợp tối đa 136 lõi trên mỗi chip. Theo Arm, hiệu năng theo rack của nền tảng này cao hơn 2 lần so với x86, đồng thời hỗ trợ băng thông bộ nhớ 6 GB/s cho mỗi lõi và độ trễ dưới 100 ns.

Với cấu hình làm mát bằng không khí, hệ thống có thể hỗ trợ tối đa 8.160 lõi trong mỗi rack. Nếu dùng làm mát bằng nước, con số này vượt 45.000 lõi. Mức TDP là 300 W. Arm cho biết hãng phân bổ lõi chuyên dụng theo từng luồng xử lý để duy trì hiệu năng ổn định, kể cả dưới tải liên tục.

CEO Arm Rene Haas cho biết công ty muốn mang thêm lựa chọn về nền tảng điện toán hiệu năng cao, tiết kiệm năng lượng cho các đối tác đang xây dựng hạ tầng agentic AI trên toàn cầu. Với bước đi sang mảng silicon, Arm hiện cung cấp ba lớp sản phẩm trong hệ sinh thái, gồm cấp phép IP, hệ thống con điện toán CSS và silicon do chính Arm thiết kế.

Theo Arm, quyết định mở rộng sang silicon xuất phát từ nhu cầu CPU tăng nhanh khi các trung tâm dữ liệu chuyển sang workload agentic AI. Hãng ước tính một trung tâm dữ liệu AI hiện cần khoảng 30 triệu lõi CPU cho mỗi gigawatt điện. Khi chuyển sang các tác vụ AI tác tử, nhu cầu này có thể tăng lên 120 triệu lõi, tức gấp hơn 4 lần.

Arm lý giải rằng các agent AI liên tục lặp lại chu trình suy luận, lập kế hoạch và thực thi, khiến lượng token sinh ra có thể cao gấp tối đa 15 lần so với con người. Trong quá trình đó, bộ tăng tốc đảm nhiệm việc tạo token, còn CPU xử lý phần điều phối, xử lý và định tuyến token. Khi agent vận hành liên tục 24/7, CPU trở thành điểm nghẽn mang tính cấu trúc và trực tiếp giới hạn khả năng khai thác hiệu năng của bộ tăng tốc. Ông Haas ví CPU như khâu dọn đường để bộ tăng tốc phát huy công suất, và cho rằng agentic AI đang khiến áp lực này lớn hơn.

Arm AGI CPU được Arm phát triển cùng Meta trong khoảng 2 năm rưỡi. Santosh Janardhan, lãnh đạo mảng hạ tầng của Meta, cho biết công ty đã tìm kiếm một đối tác có thể nâng số lõi trên mỗi watt mà vẫn bảo đảm hiệu năng. Theo ông, bài toán thực tế là nếu đẩy hiệu năng lên thì vướng điện năng, còn nếu siết điện năng thì lại thiếu hiệu năng, và Arm là lời giải phù hợp nhất. Ông nhấn mạnh đây không phải con chip chỉ dành cho Meta mà là một CPU nền tảng cho toàn bộ hệ sinh thái.

Meta hiện đặt mục tiêu đưa cụm Prometheus lên công suất hơn 1 gigawatt trong năm nay, trong khi cụm Hyperion dự kiến mở rộng lên 5 gigawatt trong vài năm tới. Công ty sẽ triển khai Arm AGI CPU cùng chip tăng tốc AI MTIA để nâng hiệu quả điều phối trong các hệ thống AI quy mô lớn.

Hai bên cho biết sẽ không dừng ở thế hệ đầu tiên mà tiếp tục hợp tác trong toàn bộ lộ trình sản phẩm tiếp theo. Theo ông Janardhan, khi những doanh nghiệp mới thách thức các tên tuổi thống trị hiện nay, đổi mới sẽ lan rộng ra toàn hệ sinh thái và hiệu năng ở các thế hệ sau sẽ tiếp tục được mở rộng theo nhiều hướng.

Trong chuỗi cung ứng toàn cầu, Arm cũng nhấn mạnh vai trò của các doanh nghiệp bán dẫn Hàn Quốc. Jun Young-hyun, Phó chủ tịch Samsung Electronics, cho rằng việc cải thiện hiệu năng ngày càng phụ thuộc vào mức độ tối ưu đồng bộ giữa chip logic, bộ nhớ và công nghệ đóng gói tiên tiến. Theo ông, các nền tảng điện toán AI định hướng mục tiêu như Arm AGI CPU có thể thúc đẩy hợp tác sâu hơn trong thiết kế silicon, tích hợp bộ nhớ và đổi mới sản xuất dựa trên tiến trình tiên tiến. Samsung Electronics vì thế có thể củng cố vị thế trong hệ sinh thái silicon của Arm nhờ năng lực tích hợp theo chiều dọc giữa foundry, bộ nhớ và đóng gói.

CEO SK hynix Kwak Noh-jung cũng cho biết khi trung tâm dữ liệu AI mở rộng, các nền tảng tối ưu cho workload AI sẽ cần công nghệ bộ nhớ tiên tiến để cung cấp dung lượng và băng thông cho các ứng dụng mới nhất. Ông bày tỏ kỳ vọng quan hệ hợp tác với Arm sẽ tiếp tục được mở rộng để phát triển hạ tầng AI thế hệ tiếp theo. Khi số lõi CPU tăng gấp 4 lần, nhu cầu băng thông bộ nhớ cũng tăng tương ứng, qua đó mở ra dư địa cho nhu cầu bộ nhớ băng thông cao, trong đó có HBM.

Việc Arm bước sang mảng silicon được dự báo sẽ kéo theo nhu cầu tối ưu tích hợp giữa thiết kế CPU với bộ nhớ và công nghệ đóng gói. Trước đó, CSS của Arm từng đóng góp gần 20% doanh thu tiền bản quyền sau 3-4 năm triển khai, nên thị trường cũng sẽ theo dõi tốc độ tăng trưởng của mảng silicon. Trong bối cảnh không chỉ Meta mà cả các ODM lớn cũng tham gia sản xuất, phạm vi tham gia của chuỗi cung ứng tiếp tục mở rộng, qua đó có thể làm rõ hơn lợi ích dành cho các đối tác Hàn Quốc.

Từ khóa

#Arm #Arm AGI CPU #agentic AI #trung tâm dữ liệu #Meta #Samsung Electronics #SK hynix #Neoverse #CSS #silicon
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.