DeepSeek ra mắt DSpark, tăng tốc phản hồi AI 60-85%

Đang tạo...

Chi-gyu Hwang (황치규)

Đăng lúc 2026-06-30 07:23:27

Chia sẻ bài viết này

DeepSeek vừa ra mắt DSpark, công nghệ mã nguồn mở nhằm tăng tốc quá trình suy luận của các mô hình ngôn ngữ lớn mà không cần thay đổi bản thân mô hình. Theo VentureBeat, giải pháp này giúp cải thiện tốc độ phản hồi mà người dùng cảm nhận được thêm 60-85%, đồng thời nâng thông lượng toàn hệ thống lên tối đa 661%.

DSpark tập trung tối ưu giai đoạn suy luận thay vì can thiệp vào cấu trúc mô hình. Cách tiếp cận này được thiết kế để rút ngắn thời gian tạo phản hồi của AI, trong khi vẫn giữ nguyên mô hình gốc.

Theo VentureBeat, các chatbot AI hiện nay thường sinh văn bản theo cách tuần tự, từng token một. Với DSpark, một mô hình phụ có kích thước nhỏ hơn và tốc độ xử lý nhanh hơn sẽ dự đoán trước một số token kế tiếp, còn mô hình lớn sẽ đối chiếu các dự đoán đó theo lô. Nếu dự đoán chính xác, hệ thống có thể xuất ra nhiều token trong một lần để tăng tốc; nếu không khớp, chỉ phần dự đoán sai bị loại bỏ và xử lý lại.

DeepSeek cho biết trong các thử nghiệm thực tế, DSpark giúp tăng tốc phản hồi thực tế từ 60% đến 85%. Bên cạnh đó, thông lượng tổng thể của hệ thống cũng tăng tối đa 661%.

VentureBeat cho biết DSpark được xây dựng trên hai kỹ thuật cốt lõi. Thứ nhất, mô hình phụ có thể dự đoán đồng thời nhiều token và tận dụng ngữ cảnh để nâng độ chính xác. Thứ hai, hệ thống tự điều chỉnh phạm vi xác minh theo tải máy chủ: khi tải thấp, số lượng dự đoán được xác minh sẽ nhiều hơn; khi tải cao, hệ thống sẽ bỏ qua những dự đoán có xác suất sai lớn.

DSpark không chỉ dùng cho mô hình DeepSeek V4 mà còn có thể áp dụng cho nhiều mô hình mã nguồn mở khác như Alibaba Qwen và Google Gemma. DeepSeek cũng đã công bố mã nguồn, quy trình huấn luyện và checkpoint của DSpark theo giấy phép MIT, cho phép sử dụng cho cả mục đích nghiên cứu lẫn thương mại.

Chi-gyu Hwang (황치규) delight@d-today.co.kr

DeepSeek ra mắt DSpark, tăng tốc phản hồi AI 60-85%

Công nghệ mã nguồn mở tối ưu suy luận, thông lượng hệ thống tăng tối đa 661%

Đang tạo...

Tóm tắt AI

DeepSeek giới thiệu DSpark, công nghệ mã nguồn mở giúp tăng tốc phản hồi AI 60-85% và nâng thông lượng hệ thống lên tối đa 661%, có thể áp dụng cho nhiều mô hình như DeepSeek V4, Alibaba Qwen và Google Gemma.

Từ khóa