Thị trường chip AI đang chuyển trọng tâm từ GPU đơn lẻ sang kiến trúc tích hợp CPU-GPU. Thay vì chỉ chạy đua về sức mạnh xử lý của GPU, năng lực kết hợp CPU, GPU và bộ nhớ trong cùng package để tối ưu luồng dữ liệu đang nổi lên như yếu tố quyết định đối với hạ tầng AI thế hệ mới.
Diễn biến trên thị trường chứng khoán Mỹ gần đây phần nào phản ánh xu hướng này. Trong nhóm bán dẫn, các cổ phiếu tăng mạnh lại nghiêng về doanh nghiệp CPU hơn là GPU. Chỉ trong một tuần, Intel tăng 23,6%, còn AMD tăng hơn 25%. Tính từ đầu năm, cổ phiếu Intel tăng 238,5% và AMD tăng 112,6%, nằm trong nhóm dẫn đầu của chỉ số Philadelphia Semiconductor.
Kết quả kinh doanh cũng góp phần củng cố đà tăng. Doanh thu quý I của Intel đạt 13,58 tỷ USD, vượt dự báo đồng thuận, trong khi biên lợi nhuận hoạt động đạt 12,3%. AMD cũng thu hút sự chú ý nhờ doanh thu CPU máy chủ tăng mạnh, qua đó hỗ trợ đà đi lên của cổ phiếu.
Động lực phía sau là sự mở rộng của AI cho suy luận và agentic AI. Nếu giai đoạn huấn luyện chủ yếu phụ thuộc vào năng lực tính toán của GPU, thì ở giai đoạn suy luận và các tác vụ AI tác tử, số lượng token tạo ra tăng nhanh, kéo theo nhu cầu lớn hơn đối với CPU và DPU để phân phối và điều phối khối lượng công việc.
Theo Eugene Investment & Securities, tương quan GPU và CPU trong hệ thống đã thay đổi từ mức 8:1 xuống khoảng 4:1. Nói cách khác, số CPU cần cho mỗi GPU hiện đã tăng gấp đôi so với trước. Hana Securities cũng nhận định nhu cầu đối với CPU máy chủ và bộ nhớ liên quan có thể tăng cùng lúc.
Diễn biến của Nvidia cho thấy xu hướng này ngày càng rõ. Tháng 2, Nvidia ký hợp đồng cung cấp riêng CPU Grace+Vera cho Meta. Đến tháng 3, tại GTC 2026, hãng tiếp tục giới thiệu hệ thống Vera dạng tray, tích hợp 8 CPU Vera.
Động thái này cho thấy Nvidia muốn mở rộng CPU thành một dòng sản phẩm riêng, thay vì chỉ bán kèm GPU theo cấu hình rack. Trên rack Kyber dùng Rubin Ultra, compute blade được thiết kế theo cấu trúc cắm dọc, tích hợp 4 GPU và 2 CPU Vera trong một cụm, qua đó tăng mạnh mức độ gắn kết vật lý giữa CPU và GPU.
Bùng nổ token, nhu cầu CPU trên mỗi GPU tăng gấp đôi
Cách kết hợp với bộ nhớ cũng đang trở thành biến số quan trọng. Rubin Ultra sử dụng 16 package HBM4E, đưa dung lượng bộ nhớ trên mỗi GPU lên tối đa 1.024 GB. Với nền tảng Feynman dự kiến ra mắt năm 2028, thị trường cũng đang nhắc tới khả năng áp dụng đồng thời công nghệ xếp chồng die 3D và HBM tùy biến.
Nvidia cũng công bố riêng rack LPX dựa trên Grok LP30, trong đó SRAM 128 GB đảm nhiệm các phép tính FFN ở giai đoạn giải mã. Đây là phần nối dài của triết lý thiết kế mới: tách vai trò của GPU, CPU và bộ nhớ theo từng chức năng, nhưng vẫn tích hợp thành một hệ thống thống nhất. Trên thực tế, bộ nhớ không còn là linh kiện phụ trợ mà đã trở thành thành phần trung tâm trong kiến trúc CPU-GPU.
Xu hướng này được cho là sẽ mang lại lợi ích cho hai hãng bộ nhớ lớn của Hàn Quốc. Khi tỷ trọng HBM trong cấu trúc package tích hợp tăng lên, lợi nhuận có xu hướng tập trung vào các doanh nghiệp sở hữu năng lực sản xuất hàng loạt HBM và công nghệ thiết kế base die.
SK hynix đang nổi lên như nhà cung cấp bộ nhớ chủ chốt cho các nền tảng Rubin và Rubin Ultra của Nvidia nhờ năng lực sản xuất HBM3E và HBM4. Trong khi đó, Samsung Electronics tham gia vào chuỗi tích hợp với vai trò foundry, đảm nhận sản xuất LP30 trên tiến trình 4nm.
Tầng phần mềm cũng đang được tái cấu trúc theo cùng hướng. CUDA của Nvidia và ROCm của AMD đều tối ưu thư viện dựa trên mô hình bộ nhớ hợp nhất giữa CPU và GPU. Xu hướng là chuyển từ giai đoạn CPU và GPU dùng các không gian bộ nhớ tách biệt, phải sao chép dữ liệu qua lại, sang kiến trúc chia sẻ cùng một không gian địa chỉ để phân bổ tác vụ tính toán hiệu quả hơn.
Khả năng áp dụng CPO (Co-Packaged Optics) cho switch NVLink từ nền tảng Feynman cũng nằm trong cùng mạch phát triển. Mục tiêu là giải tỏa nút thắt truyền dữ liệu giữa CPU, GPU và bộ nhớ bằng kết nối quang, từ đó phát huy tối đa hiệu quả của kiến trúc tích hợp.
Một nguồn tin trong ngành nhận định GPU đang dần mang tính tiêu chuẩn hóa hơn, trong khi yếu tố phân định hiệu năng hệ thống sẽ là GPU được ghép với CPU nào và cấu hình bộ nhớ ra sao. Theo đánh giá này, cục diện cạnh tranh sắp tới có thể được tái định hình quanh những doanh nghiệp đồng thời nắm năng lực thiết kế CPU và công nghệ đóng gói.