DeepSeek ra mắt V4, tăng ngữ cảnh lên 1 triệu token, tối ưu cho Huawei Ascend

DeepSeek, startup AI của Trung Quốc, đã công bố mô hình chủ lực thế hệ mới V4 với hai phiên bản V4-Pro và V4-Flash. Dòng sản phẩm mới tập trung vào ba điểm chính: mở rộng ngữ cảnh lên 1 triệu token, hạ giá API và tăng khả năng tối ưu cho chip Huawei Ascend.

Theo MIT Technology Review ngày 24/4 (giờ địa phương), đây là bản nâng cấp lớn nhất của DeepSeek kể từ khi hãng ra mắt mô hình suy luận R1 vào tháng 1/2025. Động thái này cho thấy công ty đang tăng tốc trong mảng AI mã nguồn mở.

V4-Pro được định vị cho các tác vụ lập trình và bài toán agent phức tạp, trong khi V4-Flash là phiên bản gọn nhẹ, ưu tiên tốc độ và hiệu quả chi phí. Cả hai đều có thể sử dụng trên web, ứng dụng và thông qua API dành cho nhà phát triển.

Về giá, DeepSeek tiếp tục theo đuổi chiến lược cạnh tranh bằng chi phí thấp. Theo công ty, V4-Pro có giá 1,74 USD cho mỗi 1 triệu token đầu vào và 3,48 USD cho mỗi 1 triệu token đầu ra.

V4-Flash có mức giá thấp hơn đáng kể, ở khoảng 0,14 USD cho mỗi 1 triệu token đầu vào và 0,28 USD cho mỗi 1 triệu token đầu ra. DeepSeek cho biết đây là một trong những mức giá thấp nhất ở phân khúc mô hình cao cấp.

Ở mảng hiệu năng, DeepSeek cho biết theo các bài đánh giá nội bộ, V4-Pro có thể cạnh tranh với Claude của Anthropic, dòng GPT của OpenAI và Gemini-3.1 của Google. Trong nhóm mã nguồn mở, công ty nói V4-Pro vượt Qwen của Alibaba và dòng GLM của Z.ai ở các tác vụ liên quan đến lập trình, toán học và STEM.

Một thay đổi đáng chú ý khác nằm ở khả năng xử lý ngữ cảnh dài. V4 hỗ trợ tối đa 1 triệu token ngữ cảnh và sử dụng cải tiến về kiến trúc thay vì chỉ mở rộng độ dài đầu vào theo cách thông thường.

Theo mô tả của công ty, mô hình sẽ nén bớt thông tin cũ và ưu tiên phần dữ liệu cần thiết tại từng thời điểm để nâng hiệu quả xử lý. Cách tiếp cận này được cho là giúp duy trì độ chính xác khi phân tích tài liệu dài hoặc xử lý khối lượng mã lớn, đồng thời giảm chi phí vận hành.

Cơ chế trên cũng gắn với mục tiêu tiết kiệm tài nguyên. DeepSeek cho biết V4-Pro giảm khoảng 27% tài nguyên tính toán so với V3.2, trong khi mức sử dụng bộ nhớ giảm xuống còn 10%.

V4-Flash vận hành với nhu cầu tài nguyên còn thấp hơn. Công ty kỳ vọng mức tối ưu này sẽ giúp giảm thêm chi phí triển khai các dịch vụ AI quy mô lớn.

Ở khía cạnh phần cứng, V4 đánh dấu bước đi đầu tiên của DeepSeek theo hướng giảm phụ thuộc vào Nvidia. Đây là mô hình đầu tiên của hãng được tối ưu cho chip Huawei Ascend.

Huawei cho biết hệ thống dựa trên Ascend 950 hỗ trợ V4. Động thái này được xem là một phần trong chiến lược tự chủ hạ tầng AI của Trung Quốc.

Dù vậy, một số ý kiến phân tích cho rằng quá trình chuyển đổi chưa thể diễn ra hoàn toàn trong ngắn hạn. Theo giới trong ngành, chip Trung Quốc hiện chủ yếu được sử dụng ở giai đoạn suy luận, trong khi khâu huấn luyện nhiều khả năng vẫn phụ thuộc đáng kể vào chip Nvidia.

DeepSeek cũng để ngỏ khả năng tiếp tục hạ giá. Công ty cho biết nếu chip Huawei Ascend được cung ứng ở quy mô lớn, giá của V4-Pro có thể giảm thêm.

Động thái ra mắt V4 vì vậy được xem là tín hiệu cho chiến lược AI dài hạn của Trung Quốc, hướng tới việc tự xây dựng chuỗi công nghệ gồm chip, mô hình và hạ tầng bằng công nghệ nội địa.

Trong bối cảnh DeepSeek gần đây thu hút chú ý vì tình trạng chảy máu nhân sự và áp lực từ quy định, V4 sẽ là phép thử quan trọng đối với cả năng lực công nghệ lẫn khả năng mở rộng hệ sinh thái của công ty. Tác động của mô hình mới được cho là không chỉ dừng ở cuộc đua hiệu năng, mà còn liên quan đến cạnh tranh trong AI mã nguồn mở và cuộc đua giành vị thế dẫn dắt ngành bán dẫn toàn cầu.

Jinju Hong hongjj@d-today.co.kr

DeepSeek ra mắt V4, tăng ngữ cảnh lên 1 triệu token, tối ưu cho Huawei Ascend

Hai bản Pro và Flash cạnh tranh bằng giá thấp, hiệu quả tính toán và khả năng tương thích chip Ascend nội địa

Đang tạo...

Tóm tắt AI

DeepSeek giới thiệu V4-Pro và V4-Flash với ngữ cảnh tối đa 1 triệu token, giá API thấp và tối ưu cho chip Ascend của Huawei, qua đó mở rộng hiện diện trong cuộc đua AI mã nguồn mở.

Từ khóa