Startup AI Trung Quốc DeepSeek được cho là sẽ ra mắt mô hình thế hệ mới V4 trong vài tuần tới, đồng thời chuyển từ nền tảng Nvidia sang chip do Huawei phát triển. Theo The Information, động thái này có thể trở thành một dấu mốc mới trong nỗ lực tự chủ bán dẫn của Trung Quốc.
The Information ngày 3/4 (giờ địa phương) cho biết để chuẩn bị cho V4, các tập đoàn công nghệ lớn của Trung Quốc như Alibaba Group, ByteDance và Tencent Holdings đang đặt mua số lượng lớn dòng chip mới sắp được Huawei tung ra. Dẫn lời 5 nguồn tin am hiểu các giao dịch, hãng tin này cho biết tổng đơn hàng đã lên tới hàng trăm nghìn chip.
Các công ty trên được cho là muốn triển khai DeepSeek V4 trên hạ tầng điện toán đám mây của mình, đồng thời tích hợp mô hình này vào các ứng dụng AI. Nhu cầu tăng mạnh cũng đẩy giá Ascend 950PR - dòng chip mới nhất của Huawei, dự kiến sản xuất hàng loạt từ tháng 4 - tăng 20% trong vài tuần gần đây.
Trước đó, các kỹ sư của DeepSeek chủ yếu phát triển và vận hành mô hình trên phần cứng và phần mềm của Nvidia. Tuy nhiên, việc chuyển một mô hình được huấn luyện trên hệ thống Nvidia sang chip của nhà cung cấp khác đòi hỏi phải điều chỉnh lại phần mềm nền tảng, đồng thời thử nghiệm để bảo đảm kết quả đầu ra vẫn đạt yêu cầu.
Theo The Information, trong vài tháng qua DeepSeek đã trực tiếp hợp tác với Huawei và Cambricon Technologies, một công ty thiết kế chip khác của Trung Quốc, để thực hiện quá trình chuyển đổi này. Thông tin được dẫn từ 2 nguồn tin am hiểu vấn đề.
Trước đó, DeepSeek được kỳ vọng sẽ ra mắt V4 từ tháng 2. Tuy nhiên, việc tối ưu hỗ trợ cho chip Huawei được cho là một trong những nguyên nhân khiến lịch phát hành bị lùi lại.
Ngoài phiên bản chính, DeepSeek cũng đang phát triển thêm hai biến thể của V4, được tối ưu cho các tác vụ khác nhau. Các nguồn tin cho biết cả hai phiên bản này đều sẽ chạy trên nền tảng chip do Trung Quốc phát triển.