Z.ai ra mắt GLM-5.2, chỉ sử dụng chip Ascend của Huawei để huấn luyện

GLM-5.2 gây chú ý không chỉ ở hiệu năng mà còn ở hạ tầng huấn luyện và cách triển khai. Ảnh: Shutterstock

Z.ai, startup AI Trung Quốc trước đây mang tên Zhipu AI, vừa ra mắt mô hình ngôn ngữ lớn GLM-5.2. Điểm gây chú ý là mô hình này được huấn luyện hoàn toàn trên chip Ascend của Huawei, không dùng phần cứng Nvidia. Theo công ty, GLM-5.2 đạt hiệu năng tiệm cận các mô hình hàng đầu của Anthropic, đồng thời có lợi thế về chi phí và mức độ mở.

Theo Decrypt, ngày 18/6 (giờ địa phương), Z.ai cho biết GLM-5.2 đang nằm trong nhóm mô hình có hiệu năng cao nhất thế giới ở các bài đánh giá về lập trình và tác tử AI.

Trong bài đánh giá FrontierSWE, vốn đo khả năng phát triển phần mềm tự trị trong thời gian dài, GLM-5.2 đạt 74,4 điểm. Mức này gần với Claude Opus 4.8 của Anthropic ở 75,1 điểm và cao hơn GPT-5.5 với 72,6 điểm.

Với SWE-bench Pro, bài đánh giá khả năng xử lý issue trên GitHub, GLM-5.2 đạt 62,1 điểm, vượt GPT-5.5 ở 58,6 điểm và cao hơn GLM-5.1 ở 58,4 điểm.

Không chỉ hiệu năng, hạ tầng phát triển của mô hình cũng thu hút sự quan tâm. Z.ai cho biết GLM-5.2 được huấn luyện chỉ bằng chip Ascend, dòng bộ tăng tốc AI của Huawei, và không sử dụng phần cứng Nvidia trong toàn bộ quá trình huấn luyện.

Động thái này diễn ra trong bối cảnh Mỹ tiếp tục siết xuất khẩu chất bán dẫn tiên tiến sang Trung Quốc. Theo đó, việc một doanh nghiệp Trung Quốc xây dựng được mô hình thuộc nhóm dẫn đầu bằng hạ tầng AI nội địa đang được xem là tín hiệu đáng chú ý của thị trường.

Cách Z.ai phát hành mô hình cũng thu hút thêm chú ý. GLM-5.2 được công bố theo giấy phép MIT, không áp dụng hạn chế sử dụng theo quốc gia. Nhà phát triển có thể tải trực tiếp trọng số mô hình trên Hugging Face, bao gồm cả các phiên bản đã được lượng tử hóa.

Người dùng dịch vụ lập trình của Z.ai có thể chọn dòng mô hình GLM-5.2 để sử dụng ngay mà không phải xếp hàng. Công ty cũng cung cấp gói dùng thử miễn phí với một số giới hạn nhất định.

Một trong những điểm được giới phát triển quan tâm nhất là khả năng xử lý ngữ cảnh dài. GLM-5.2 hỗ trợ cửa sổ ngữ cảnh tối đa 1 triệu token, gấp 5 lần mức 200.000 token của GLM-5.1. Nhờ đó, mô hình có thể phân tích toàn bộ kho mã lớn trong một lần, thực hiện chỉnh sửa trên nhiều tệp cùng lúc hoặc vận hành các pipeline tác tử AI phức tạp. Mô hình được xây dựng theo kiến trúc MoE (Mixture of Experts) với quy mô 744 tỷ tham số.

Z.ai cũng nhấn mạnh lợi thế về giá. API của GLM-5.2 có giá 1,40 USD cho mỗi 1 triệu token đầu vào và 4,40 USD cho mỗi 1 triệu token đầu ra, thấp hơn đáng kể so với Claude Opus 4.8, lần lượt ở mức 5 USD và 25 USD. Gói dịch vụ lập trình có giá khởi điểm khoảng 18 USD/tháng và hỗ trợ tích hợp với các công cụ phát triển AI phổ biến như Claude Code, Cline và Kilo Code.

Khả năng chạy trực tiếp trên môi trường cục bộ cũng là một điểm đáng chú ý. Unsloth AI, công ty chuyên tối ưu hóa AI, đã lượng tử hóa GLM-5.2 sang định dạng GGUF 2-bit, giúp giảm dung lượng từ 1,51 TB xuống còn khoảng 238 GB. Dù vậy, để duy trì khoảng 82% hiệu năng, hệ thống vẫn cần tối thiểu 256 GB bộ nhớ hợp nhất, hoặc cấu hình RAM và VRAM tương đương, nên yêu cầu phần cứng vẫn còn cao với người dùng phổ thông.

Phản ứng của thị trường cũng khá mạnh. Z.ai, có trụ sở tại Bắc Kinh, đã bị Mỹ đưa vào danh sách kiểm soát xuất khẩu từ tháng 1/2025. Tuy nhiên, sau khi GLM-5.2 được công bố, cùng với các vấn đề liên quan đến hạn chế truy cập mô hình của Anthropic, cổ phiếu công ty đã tăng khoảng 90% trong vòng một tuần và lập đỉnh lịch sử.

Ở các đánh giá độc lập, Artificial Analysis xếp GLM-5.2 là mô hình AI mã nguồn mở số một hiện nay trên Intelligence Index. OpenRouter cũng đưa GLM-5.2 vào nhóm mô hình dẫn đầu.

Dù vậy, khoảng cách với các mô hình đóng tiên tiến nhất vẫn chưa hoàn toàn được thu hẹp. Trong bài đánh giá SWE-Marathon, vốn đo khả năng xử lý các bài toán khó đòi hỏi duy trì tác vụ trong thời gian dài, GLM-5.2 đạt 13,0 điểm, thấp hơn đáng kể so với 26,0 điểm của Claude Opus 4.8. Điều này cho thấy mô hình đã chứng minh được năng lực ở các tác vụ lập trình tự trị kéo dài, nhưng vẫn còn khoảng cách ở những bài toán khó nhất đòi hỏi suy luận phức hợp.

Dù vậy, lần ra mắt này vẫn được xem là minh chứng cho thấy các doanh nghiệp Trung Quốc có thể phát triển mô hình mã nguồn mở thuộc nhóm hàng đầu thế giới mà không cần chip AI của Mỹ. Khi một mô hình đồng thời cạnh tranh được về hiệu năng, chi phí và độ mở, cuộc đua trong hệ sinh thái AI có thể sẽ không chỉ dừng ở mô hình, mà còn lan sang chuỗi cung ứng chip và chiến lược mã nguồn mở.

Jinju Hong hongjj@d-today.co.kr

Z.ai ra mắt GLM-5.2, chỉ sử dụng chip Ascend của Huawei để huấn luyện

Hiệu năng tiệm cận Claude Opus 4.8, phát hành theo giấy phép MIT

Đang tạo...

Tóm tắt AI

Z.ai giới thiệu GLM-5.2, mô hình AI được huấn luyện hoàn toàn trên chip Ascend của Huawei, đạt kết quả tiệm cận Claude Opus 4.8 và phát hành theo giấy phép MIT.

Từ khóa