Qualcomm nhấn mạnh hiệu quả điện là lợi thế cạnh tranh cốt lõi của chip AI cho trung tâm dữ liệu. Ảnh: Shutterstock

Qualcomm đang tìm cách trở lại thị trường chip AI cho trung tâm dữ liệu bằng một kiến trúc bộ nhớ mới. Thay vì đi theo hướng HBM, hãng chọn thiết kế dựa trên LPDDR để tạo khác biệt ở mảng suy luận AI.

Theo TechRadar, ngày 1/7 (giờ địa phương), Qualcomm đã công bố kiến trúc bộ nhớ thế hệ mới mang tên High Bandwidth Compute (HBC), đồng thời cho biết sẽ ra mắt bộ tăng tốc AI250 dành cho suy luận AI vào giữa năm 2027.

Trọng tâm của HBC là kiến trúc Near-Memory Compute, trong đó bộ nhớ được xếp chồng trực tiếp lên trên khối tính toán. So với cách tách rời bộ nhớ và bộ xử lý truyền thống, thiết kế này giúp rút ngắn đường truyền dữ liệu, qua đó tăng băng thông và cải thiện hiệu quả điện năng.

Qualcomm cho biết cấu trúc trên có thể đạt băng thông bộ nhớ tối đa 133 TB/s.

Hãng định vị HBC như một lựa chọn thay thế trong thị trường chip AI vốn hiện chủ yếu xoay quanh HBM. Theo Qualcomm, thế hệ HBC đầu tiên hỗ trợ dung lượng bộ nhớ tối đa 768 GB và trong môi trường suy luận AI quy mô lớn, băng thông bộ nhớ trên mỗi watt có thể cao hơn tối đa 6 lần so với HBM.

Đáng chú ý, trong các tác vụ suy luận kết hợp cả mô hình nhỏ lẫn mô hình lớn, chẳng hạn AI tạo mã lập trình, hiệu quả năng lượng có thể được cải thiện tối đa 200 lần. Qualcomm gọi đây là công nghệ giúp loại bỏ “HBM Tax”.

Tuy nhiên, một số ý kiến cho rằng các số liệu so sánh này chưa được đặt trên cùng điều kiện. Trong khi HBM4 thường được đánh giá theo băng thông thuần của bộ nhớ, các con số Qualcomm đưa ra lại phản ánh hiệu quả của toàn bộ kiến trúc kết hợp giữa tính toán và bộ nhớ.

Vì vậy, giới trong ngành cho rằng không thể so sánh trực tiếp hai công nghệ chỉ dựa trên một vài chỉ số riêng lẻ.

Điểm Qualcomm nhấn mạnh nhiều nhất là hiệu quả điện năng. Khi AI tạo sinh phát triển nhanh, mức tiêu thụ điện tại các trung tâm dữ liệu cũng tăng mạnh, kéo theo áp lực lớn về chi phí điện và làm mát.

Trong bối cảnh đó, Qualcomm muốn đưa kinh nghiệm thiết kế chip tiết kiệm điện tích lũy từ mảng smartphone sang chip AI cho trung tâm dữ liệu để tạo lợi thế cạnh tranh.

Song song với công nghệ, hãng cũng đẩy mạnh hợp tác và công bố Meta cùng Microsoft là hai đối tác chủ chốt. Qualcomm cho biết đã ký thỏa thuận hợp tác AI nhiều năm với Meta, theo đó các bộ xử lý của hãng sẽ được sử dụng trong dự án liên quan.

Microsoft cũng đang mở rộng hợp tác với Qualcomm trên các mảng trung tâm dữ liệu, PC và AI chạy cục bộ. Trước đó, CEO của Microsoft Satya Nadella từng nhấn mạnh việc giảm tiêu thụ điện và nước trong quá trình mở rộng hạ tầng AI là một ưu tiên quan trọng, cho thấy xu hướng xây dựng trung tâm dữ liệu theo hướng tối ưu hiệu quả vận hành.

Vì thế, chiến lược chip tiết kiệm điện của Qualcomm không chỉ là cuộc đua về hiệu năng, mà còn gắn với mục tiêu cắt giảm chi phí vận hành cho các khách hàng lớn.

Cạnh tranh ở mảng công nghệ bộ nhớ được dự báo sẽ còn gay gắt hơn. Hiện Samsung Electronics, SK hynix và SanDisk cũng đang thúc đẩy High Bandwidth Flash (HBF), một công nghệ bộ nhớ thế hệ mới nhắm tới thị trường suy luận AI.

Đặc biệt, trong các môi trường suy luận AI tạo sinh có tỷ trọng tác vụ đọc cao, khả năng xuất hiện nhiều kiến trúc bộ nhớ cạnh tranh song song với HBM đang ngày càng rõ nét.

Dù vậy, các số liệu về hiệu năng và hiệu quả mà Qualcomm công bố hiện vẫn chưa được kiểm chứng độc lập. Theo giới quan sát, khi sản phẩm thực tế ra mắt, mức độ hiện thực hóa những chỉ số này mới là yếu tố quyết định năng lực cạnh tranh trên thị trường.

Việc ký kết hợp tác với Meta và Microsoft cũng được xem là tín hiệu cho thấy Qualcomm, vốn có thế mạnh ở chip di động, đang muốn mở rộng hiện diện sang thị trường chip AI cho trung tâm dữ liệu. Thị trường hiện theo dõi liệu động thái này có tạo ra một cục diện cạnh tranh mới trong sân chơi chip AI do Nvidia dẫn dắt hay không.

Từ khóa

#Qualcomm #HBC #High Bandwidth Compute #HBM #LPDDR #AI250 #chip AI #suy luận AI #trung tâm dữ liệu #Meta #Microsoft
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.