DeepSeek. Ảnh: Shutterstock

DeepSeek, startup AI của Trung Quốc, được cho là đang đàm phán huy động khoảng 70 tỷ nhân dân tệ trong bối cảnh vẫn duy trì các mô hình mở miễn phí và chiến lược API giá rẻ. Theo giới phân tích, lợi thế cạnh tranh cốt lõi của công ty nằm ở khả năng tối ưu bộ nhớ và hiệu suất tính toán.

Ngày 26/5/2026, trang tin công nghệ Gigazine đưa tin DeepSeek đang tiến hành các cuộc đàm phán gọi vốn quy mô lớn, với giá trị ước khoảng 70 tỷ nhân dân tệ.

DeepSeek thu hút sự chú ý của ngành AI toàn cầu sau khi công bố DeepSeek-R1 vào tháng 1/2025. Khi đó, mô hình này được đánh giá có hiệu năng tương đương mô hình suy luận o1 của OpenAI.

Đến tháng 5 năm nay, DeepSeek-V4-Pro được Trung tâm Tiêu chuẩn hóa và Đổi mới AI của Mỹ (CAISI) nhận định đạt ngưỡng hiệu năng tương đương GPT-5. Dù vậy, cũng có phân tích cho rằng mô hình này vẫn chậm khoảng 8 tháng so với các mô hình tiên tiến nhất của Mỹ.

Điểm đáng chú ý hơn cả là chính sách giá. DeepSeek gần như đã biến mức giá API rẻ hơn tới 75% từng áp dụng ở giai đoạn đầu thành chính sách thường trực. So với các mô hình có hiệu năng tương đương, đây được xem là lợi thế cạnh tranh rõ rệt.

Alibaba và Zhipu AI (Z.ai) cũng tham gia xu hướng công bố miễn phí các mô hình tiên tiến. Tuy nhiên, hai doanh nghiệp này được cho là vẫn theo đuổi hướng kiếm tiền tương đối rõ ràng, chẳng hạn xây dựng hệ thống agent. Trong khi đó, DeepSeek vẫn tiếp tục đàm phán gọi vốn lớn dù chưa cho thấy mô hình doanh thu nổi bật.

Theo nhà phân tích AI GDP, mấu chốt nằm ở “hiệu suất vượt trội”. Các mô hình ngôn ngữ lớn (LLM) thường sử dụng cấu trúc KV cache để lưu trữ và tái sử dụng kết quả tính toán. Thiết kế của DeepSeek được cho là giúp giảm mạnh mức tiêu thụ bộ nhớ trong quá trình này.

Với đầu vào 1 triệu token, GLM-5 tiêu tốn 60GB bộ nhớ, còn Qwen3-235B-A22B cần 89GB. Trong khi đó, DeepSeek-V4 được phân tích chỉ cần 5,48GB.

Khoảng cách này không chỉ mang ý nghĩa kỹ thuật mà còn tác động trực tiếp đến cấu trúc chi phí. Trong ngành AI, giá bộ nhớ tăng mạnh đang trở thành gánh nặng lớn đối với doanh nghiệp.

Theo Gigazine, khoảng 63% chi phí chip AI hiện đến từ bộ nhớ. Trong một số môi trường, chi phí bộ nhớ thậm chí còn là áp lực lớn hơn cả GPU. Trong bối cảnh đó, kiến trúc hiệu suất cao của DeepSeek có thể giúp cắt giảm đáng kể chi phí vận hành mô hình, đồng thời tạo nền tảng để cải thiện khả năng sinh lời.

Hiệu quả này còn thể hiện ở tốc độ suy luận. DeepSeek được đánh giá đã tối ưu cấu trúc khai thác cache, qua đó giảm độ trễ ngay cả khi chạy trên các chip AI có hiệu năng thấp hơn.

Theo thông tin được chia sẻ, DeepSeek-V4-Pro chỉ cần khoảng 1/3,7 lượng tính toán so với mô hình thế hệ trước. Với DeepSeek-V4-Flash, mức này chỉ còn khoảng 1/9,8.

Chiến lược trên cũng gắn với thực tế mà ngành AI Trung Quốc đang phải đối mặt. Do các biện pháp hạn chế xuất khẩu của Mỹ, doanh nghiệp Trung Quốc gặp khó trong việc tiếp cận những chip AI hiệu năng cao mới nhất của Nvidia.

Vì vậy, nếu vẫn có thể triển khai dịch vụ AI hiệu năng cao trên phần cứng cấu hình thấp hơn, doanh nghiệp không chỉ giảm được chi phí mà còn củng cố lợi thế về độ ổn định của chuỗi cung ứng.

Một số phân tích trên thị trường cho rằng kế hoạch huy động 70 tỷ nhân dân tệ của DeepSeek không chỉ phục vụ phát triển mô hình, mà còn gắn với chiến lược dài hạn hơn. GDP dự báo nguồn vốn này có thể được tái đầu tư vào các doanh nghiệp bộ nhớ và chip AI tại Trung Quốc, nhằm xây dựng một “hệ sinh thái AI tối ưu chi phí”.

Theo cách nhìn này, DeepSeek có thể mở rộng thị phần nhờ các mô hình miễn phí và API giá rẻ, trong khi lợi nhuận thực sự đến từ thiết kế mô hình hiệu suất cao và việc xây dựng chuỗi cung ứng phần cứng nội địa.

Giới công nghiệp nhận định nếu chiến lược này thành hiện thực, các công ty AI Trung Quốc có thể vượt khỏi cuộc cạnh tranh đơn thuần về giá và nổi lên như một lựa chọn thay thế mới trên thị trường AI toàn cầu.

Từ khóa

#DeepSeek #trí tuệ nhân tạo #API giá rẻ #LLM #KV cache #tối ưu bộ nhớ #GPU #chip AI
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.