Ngày 24/4, Wall Street Journal (WSJ) đưa tin công ty AI Trung Quốc DeepSeek đã giới thiệu các bản preview của mô hình mới V4, trong đó nhấn mạnh lợi thế chi phí như một điểm khác biệt chính.
DeepSeek công bố loạt mô hình này trên tài khoản WeChat chính thức của hãng.
Theo DeepSeek, bản V4-Pro cải thiện đáng kể khả năng coding agent so với các mô hình trước đó. Công ty cho biết, về trải nghiệm sử dụng, mô hình này vượt Claude Sonnet 4.5 của Anthropic. Chất lượng đầu ra ở chế độ non-thought tiệm cận Claude Opus 4.6, dù vẫn chưa đạt mức của Opus 4.6 trong chế độ thought.
V4 ra mắt sau nhiều lần DeepSeek trì hoãn kế hoạch cập nhật các mô hình chủ lực, trong bối cảnh hàng loạt đối thủ tại Trung Quốc liên tục tung phiên bản mới. Moonshot AI, MiniMax, Alibaba và ByteDance là những cái tên đang đẩy nhanh nhịp cập nhật mô hình.
Một điểm đáng chú ý khác là V4 hỗ trợ chip Ascend của Huawei. DeepSeek cho biết hãng đã kiểm chứng công nghệ tối ưu hiệu năng cốt lõi của V4 trên cả GPU của Nvidia và NPU Ascend của Huawei. Về phía Huawei, công ty khẳng định toàn bộ dòng Ascend đều hỗ trợ đầy đủ các mô hình DeepSeek V4.
V4 sử dụng công nghệ Sparse Attention được giới thiệu từ năm ngoái. Thay vì xử lý toàn bộ nội dung cùng lúc, công nghệ này tập trung vào những phần liên quan nhất, qua đó cho phép xử lý ngữ cảnh và tài liệu dài hơn đáng kể.
Giá thành cũng là điểm nhấn của đợt ra mắt này. Chi phí cho 1 triệu token đầu ra của V4-Pro là 3,48 USD, thấp hơn đáng kể so với mức 25 USD của Anthropic Opus 4.6. DeepSeek đồng thời giới thiệu V4-Flash, phiên bản có chi phí thấp hơn và tốc độ nhanh hơn; mô hình này cho hiệu năng tương đương V4-Pro ở các tác vụ đơn giản nhưng kém hơn ở những bài toán phức tạp.