Prism ML vừa công bố Bonsai Image 4B, mô hình AI tạo ảnh có thể chạy cục bộ trên iPhone mà không cần xử lý trên đám mây.
Theo Gigazine ngày 27/5, công nghệ cốt lõi của mô hình này là phiên bản tinh gọn từ FLUX.2 Klein 4B, với mức dùng bộ nhớ được cắt giảm mạnh để phù hợp với smartphone.
Động thái của Prism ML diễn ra trong bối cảnh cuộc đua AI on-device ngày càng nóng lên. Công ty phát triển kỹ thuật nén mô hình bằng phương pháp lượng tử hóa, đưa trọng số về hai mức “-1” và “1”, hoặc ba mức “-1”, “0” và “1”. Trước đó, vào tháng 4, hãng cũng từng giới thiệu “1-bit Bonsai 8B” - mô hình ngôn ngữ 8 tỷ tham số có thể chạy trên iPhone.
Bonsai Image 4B là phiên bản được tái huấn luyện từ FLUX.2 Klein 4B và được phát hành dưới dạng mô hình mở. Prism ML hiện cung cấp hai biến thể gồm “1-bit Bonsai Image 4B”, sử dụng hai giá trị “-1” và “1”, và “Ternary Bonsai Image 4B”, sử dụng ba giá trị “-1”, “0” và “1”.
Theo Prism ML, mức cắt giảm bộ nhớ là rất lớn. Nếu FLUX.2 Klein 4B bản gốc cần khoảng 7,75GB, thì 1-bit Bonsai Image 4B chỉ còn 0,93GB và Ternary Bonsai Image 4B là 1,21GB. Công ty cho biết chất lượng ảnh đầu ra vẫn được duy trì ở mức cao; theo đánh giá nội bộ, mô hình 1-bit đạt khoảng 88% chất lượng so với bản gốc, còn bản 3 giá trị đạt 95%.
Prism ML đồng thời phát hành miễn phí ứng dụng “Bonsai Studio” trên App Store. Người dùng có thể mở ứng dụng, tải mô hình và tạo ảnh trực tiếp trên iPhone. Theo Gigazine, tệp mô hình của bản ternary có dung lượng khoảng 3,89GB.
Về hiệu năng, trên iPhone 17 Pro, mô hình mất khoảng 12 giây để tạo một ảnh 512 x 512 pixel. Gigazine cho biết người dùng có thể nhập prompt như “broccoli bonsai, Japanese garden, photoreal” để tạo ảnh theo yêu cầu; các ảnh phong cách hoạt hình hoặc chân dung cũng được tạo theo cách tương tự.
Không chỉ giới hạn trên iPhone, Bonsai Image 4B còn có thể chạy trên PC dùng Windows 11 và trên môi trường macOS, theo Prism ML.
Giới quan sát trong ngành cho rằng lần ra mắt này cho thấy AI tạo ảnh đang tiến gần hơn tới ngưỡng vận hành hoàn toàn trên smartphone mà không cần kết nối mạng. Việc kéo mức dùng bộ nhớ xuống quanh 1GB, đồng thời cho phép trải nghiệm trực tiếp qua ứng dụng miễn phí, là tín hiệu cho thấy cuộc đua AI on-device có thể sớm mở rộng từ tạo văn bản sang tạo ảnh.