DeepSeek. Ảnh: Shutterstock

Một năm sau khi DeepSeek ra mắt mô hình suy luận R1, các công ty AI Trung Quốc đang nhanh chóng mở rộng ảnh hưởng trên thị trường toàn cầu nhờ chiến lược phát triển mô hình mở. Theo MIT Technology Review, Trung Quốc hiện đã lần đầu vượt Mỹ về tỷ trọng lượt tải xuống mô hình AI trên phạm vi toàn cầu.

MIT Technology Review ngày 21/4 (giờ địa phương) cho biết các doanh nghiệp AI Trung Quốc đang tận dụng mô hình mở để thu hút cộng đồng nhà phát triển. Trong khi nhiều công ty Mỹ vẫn theo đuổi chiến lược khép kín dựa trên API, doanh nghiệp Trung Quốc lại phát hành các mô hình cho phép tải về, chạy trên hạ tầng riêng và tùy chỉnh theo nhu cầu sử dụng.

Bước ngoặt xuất hiện vào tháng 1/2025, khi DeepSeek công bố R1. Mô hình này được đánh giá có hiệu năng tương đương các hệ thống hàng đầu của Mỹ nhưng với chi phí thấp hơn, qua đó rút ngắn khoảng cách giữa các viện nghiên cứu AI của Trung Quốc và Mỹ. Sự quan tâm từ cộng đồng nhà phát triển vì thế cũng tăng mạnh.

Sau DeepSeek, nhiều công ty như Z.ai, Moonshot, Alibaba với dòng Qwen, hay MiniMax đã đi theo hướng tương tự. Các doanh nghiệp này liên tục tung ra những mô hình có hiệu năng cao hơn để cạnh tranh với đối thủ Mỹ. Khi ngành AI chuyển trọng tâm từ giai đoạn thử nghiệm sang triển khai và tích hợp thực tế, lợi thế về chi phí thấp và khả năng tùy biến của các mô hình này càng trở nên rõ rệt.

Số liệu cũng cho thấy xu hướng đó. Theo nhóm nghiên cứu của MIT và Hugging Face, trong giai đoạn một năm tính đến tháng 8/2025, các mô hình AI mở của Trung Quốc chiếm 17,1% tổng lượt tải xuống mô hình AI toàn cầu. Trong khi đó, tỷ trọng của Mỹ là 15,86%. Đây là lần đầu tiên Trung Quốc vượt Mỹ ở chỉ số này.

Dữ liệu từ Hugging Face trong tháng trước cũng cho thấy số mô hình phái sinh do người dùng tạo ra từ các mô hình của Alibaba và dòng Qwen đã vượt tổng số mô hình phái sinh từ Google và Meta cộng lại.

Tuy nhiên, các mô hình AI Trung Quốc vẫn đối mặt với không ít rào cản. Những mô hình này chịu tác động từ cơ chế kiểm duyệt nội dung và được huấn luyện để tránh tạo ra các phản hồi đi ngược chính sách của chính phủ. Tháng 2, Anthropic cáo buộc một số viện nghiên cứu Trung Quốc đã khai thác trái phép năng lực của Claude thông qua phương pháp chưng cất. Đây là kỹ thuật sử dụng đầu ra của một mô hình để huấn luyện mô hình khác.

Dù vấp phải phản ứng từ phương Tây, mức độ tiếp nhận các mô hình Trung Quốc tại Global South vẫn tăng lên. AI Singapore, một chương trình do chính phủ Singapore hỗ trợ, đã chọn Qwen của Alibaba thay cho Llama của Meta làm nền tảng phát triển mô hình khu vực mới nhất. Năm ngoái, Malaysia cũng cho biết sẽ vận hành hệ sinh thái AI trong nước dựa trên DeepSeek. Nhiều nhà sáng lập tại Nairobi, Sao Paulo và San Francisco hiện cũng đang xây dựng dịch vụ trên nền các mô hình của Trung Quốc.

Về phía Mỹ, các công ty công nghệ vẫn duy trì chiến lược khép kín với lý do cần thu hồi chi phí huấn luyện rất lớn, đồng thời lo ngại nguy cơ mô hình bị lạm dụng. Ngược lại, trong bối cảnh bị hạn chế tiếp cận chip tiên tiến do các biện pháp kiểm soát xuất khẩu của Mỹ, doanh nghiệp Trung Quốc chọn cách công khai mô hình để nhanh chóng thu hút phản hồi và đóng góp từ bên ngoài. Theo MIT Technology Review, xu hướng này đang khiến tương lai của AI trở nên đa cực hơn so với kỳ vọng trước đó của Thung lũng Silicon.

Từ khóa

#AI #mô hình AI mở #DeepSeek #Hugging Face #Alibaba #Qwen
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.