Mustafa Suleyman: Mô hình AI nguồn mở do Trung Quốc phát triển dựa vào chưng cất khó đi xa

Đang tạo...

Chi-gyu Hwang

Đăng lúc 2026-05-30 11:20:24

Chia sẻ bài viết này

Mustafa Suleyman, Giám đốc điều hành Microsoft AI. Ảnh: Wikimedia

Mustafa Suleyman, người đứng đầu mảng AI của Microsoft, cho rằng các mô hình AI nguồn mở do Trung Quốc phát triển, trong đó có DeepSeek, đang bộc lộ giới hạn khi phụ thuộc vào phương pháp chưng cất.

Theo Semafor ngày 29/5 (giờ địa phương), trong một cuộc phỏng vấn gần đây, ông Suleyman nhận định chưng cất (distillation) - tức huấn luyện mô hình nhỏ dựa trên dữ liệu đầu ra do các mô hình lớn từ những hãng AI hàng đầu như OpenAI và Anthropic tạo ra - rốt cuộc sẽ đi tới điểm nghẽn. Theo ông, cách làm này về bản chất là đưa tri thức từ mô hình của bên khác vào một mô hình mới.

Microsoft hiện phát triển các mô hình AI nội bộ theo nguyên tắc không dùng chưng cất. Ông Suleyman cho rằng phương pháp này có thể hiệu quả khi xây dựng các mô hình nhỏ phục vụ một nhiệm vụ cụ thể, nhưng với các bài toán mang tính tổng quát, chúng rốt cuộc vẫn sẽ bị bỏ lại phía sau so với các mô hình tuyến đầu.

Ông cũng lưu ý rằng các công ty AI hàng đầu không công khai những bộ dữ liệu khổng lồ dùng để huấn luyện mô hình lớn. Vì vậy, rất khó xác định các mô hình phát triển bằng chưng cất thực chất đã học được trọng tâm gì hoặc được tối ưu theo hướng nào.

Semafor cho biết kịch bản các mô hình chưng cất giá rẻ từ Trung Quốc thống trị thị trường đã không xảy ra. Trái lại, nhu cầu đối với các mô hình AI tuyến đầu đang tăng nhanh hơn nhiều so với mô hình nguồn mở. Theo tờ báo này, nếu nhận định của ông Suleyman là chính xác, khoảng cách giữa mô hình AI tuyến đầu và mô hình nguồn mở có thể lớn hơn đáng kể so với suy nghĩ của nhiều người.

Chi-gyu Hwang delight@d-today.co.kr

Mustafa Suleyman: Mô hình AI nguồn mở do Trung Quốc phát triển dựa vào chưng cất khó đi xa

Microsoft phát triển AI nội bộ theo nguyên tắc không dùng chưng cất, trong khi nhu cầu với mô hình tuyến đầu tăng mạnh

Đang tạo...

Tóm tắt AI

Mustafa Suleyman cho rằng việc dùng dữ liệu đầu ra từ mô hình lớn để huấn luyện mô hình nhỏ chỉ phù hợp với bài toán hẹp, khó bắt kịp các mô hình AI tuyến đầu.

Từ khóa