Ngành trí tuệ nhân tạo Trung Quốc đang ngày càng lo ngại về năng lực cạnh tranh thực sự của các mô hình ngôn ngữ lớn (LLM). Dù khoảng cách với Mỹ trên các bảng đánh giá công khai có vẻ thu hẹp, nhiều ý kiến trong ngành cho rằng Trung Quốc vẫn chủ yếu ở thế bám đuổi về đổi mới công nghệ. Trong bối cảnh đó, một số công ty bắt đầu chuyển hướng sang AI tạo video như một lối đi mới, thay vì chỉ tập trung vào LLM dựa trên văn bản.
Theo South China Morning Post (SCMP) ngày 22/5 giờ địa phương, Liu Wei, người từng phụ trách tổ chức AI tạo sinh Hunyuan của Tencent, nhận định vấn đề lớn nhất của ngành AI Trung Quốc hiện nay là “thiếu đổi mới mang tính thay đổi mô hình”. Theo ông, nhiều doanh nghiệp trong nước vẫn chủ yếu đi theo con đường mà DeepSeek hoặc các công ty Mỹ đã mở ra ở những công nghệ cốt lõi.
Liu Wei cho rằng điểm số trên các bài kiểm tra công khai không phản ánh đầy đủ năng lực công nghệ thực tế. Theo đánh giá của ông, các mô hình Trung Quốc có thể đạt kết quả benchmark tương đương doanh nghiệp Mỹ, nhưng vẫn tồn tại khoảng cách về khả năng ứng dụng cũng như tốc độ đổi mới. Trong khi các công ty Mỹ liên tục đưa ra hướng tiếp cận công nghệ mới, các doanh nghiệp dẫn đầu của Trung Quốc phần lớn vẫn tập trung đuổi theo càng nhanh càng tốt.
Ông ước tính khoảng cách công nghệ AI giữa Mỹ và Trung Quốc hiện ít nhất là 3 tháng và có thể nới lên 6 tháng ngay trong năm nay. Liu Wei cũng nhắc đến khả năng OpenAI ra mắt thế hệ mô hình tiếp theo là GPT-5.6, qua đó tiếp tục gia tăng tốc độ ở cuộc đua công nghệ AI.
Theo Liu Wei, các doanh nghiệp Trung Quốc hiện “đang sao chép doanh nghiệp Mỹ ở cấp độ công nghệ lõi”. Ông cảnh báo rằng nếu đánh mất năng lực đổi mới ở cấp độ mô hình, thị trường cuối cùng sẽ bị đảo chiều bởi những công ty khác. Muốn tồn tại trong cuộc cạnh tranh AI, doanh nghiệp không thể chỉ chạy theo mà phải tự mở ra hướng công nghệ mới.
Từ nhận định đó, Liu Wei đã rời khỏi cuộc đua LLM để chuyển sang AI tạo video. Ông cùng các nhà đồng sáng lập thành lập startup Video Reverse, đặt trụ sở tại Singapore, đồng thời bố trí đội ngũ R&D chủ chốt tại Hong Kong.
Công ty gần đây đã giới thiệu engine AI tạo video Bach, nhắm đến khách hàng doanh nghiệp và nhóm người dùng bán chuyên. Tổng số vốn huy động đến nay đạt khoảng 80 triệu USD và công ty vẫn đang tiếp tục gọi thêm vốn. Theo Liu Wei, AI tạo video là một trong số ít mảng mà Trung Quốc hiện có lợi thế cạnh tranh tương đối rõ.
Trên thực tế, các mô hình AI tạo video của Trung Quốc như SeaDance của ByteDance hay Kling của Kuaishou đều đang được xếp hạng cao trên thế giới. Theo công ty phân tích độc lập Artificial Analysis, nhiều mô hình tạo video nằm trong nhóm dẫn đầu hiện nay là sản phẩm của doanh nghiệp Trung Quốc. Bach cũng nhanh chóng lọt vào nhóm xếp hạng cao toàn cầu ngay sau khi ra mắt.
Một trong những lý do khiến AI tạo video được chú ý là yêu cầu về tài nguyên tính toán. Do tác động từ các biện pháp kiểm soát xuất khẩu chất bán dẫn của Mỹ, doanh nghiệp Trung Quốc bị hạn chế trong việc tiếp cận các chip AI tiên tiến nhất. Trong khi đó, mô hình tạo video cần quy mô tham số nhỏ hơn so với các LLM hàng đầu, nên có thể được phát triển với lượng tài nguyên tính toán thấp hơn.
Liu Wei cho rằng đây có thể là cơ hội cho doanh nghiệp Trung Quốc. Ông phân tích rằng các công ty Mỹ thời gian gần đây dồn nhiều nguồn lực vào cuộc đua LLM, vì vậy tốc độ ở mảng tạo video có phần chậm lại. Ông cũng nhắc đến động thái OpenAI tạm dừng Sora như một phần của xu hướng này.
Video Reverse cho biết sẽ mở rộng từ mô hình tạo video sang phát triển world model, tức mô hình mô phỏng thế giới thực theo thời gian thực. Hiện công ty đang phát triển thế hệ AI video mới Bach 2.0 cùng mô hình Olympus phục vụ mô phỏng.
Trường hợp của Video Reverse cho thấy ngành AI Trung Quốc đang tìm kiếm những lĩnh vực mới để thoát khỏi thế chỉ chạy theo Mỹ. Khi AI tạo video nổi lên như một chiến địa tương đối thuận lợi cho doanh nghiệp Trung Quốc, cạnh tranh AI toàn cầu cũng có thể dần mở rộng từ trọng tâm LLM dựa trên văn bản sang các lĩnh vực đa phương thức và tạo video.