Bonsai Image 4B的核心亮点在于大幅压缩图像生成模型的内存占用,进一步拓展智能手机本地运行的可能性。图片来源:Gigazine

Prism ML发布了可在iPhone本地运行的图像生成模型“Bonsai Image 4B”。

据Gigazine 27日 报道,这款模型基于现有图像生成模型FLUX.2 Klein 4B进行轻量化改造,重点在于显著降低内存占用,使图像生成模型能够在智能手机端运行。

这一动向也被视为端侧AI竞争持续升温的最新案例。Prism ML长期推进模型量化技术,通过二值和三值量化方式压缩模型规模,以降低内存占用。今年4月,该公司还曾推出可在iPhone上运行的80亿参数语言模型“1-bit Bonsai 8B”。

此次发布的Bonsai Image 4B,是在FLUX.2 Klein 4B基础上重新训练得到的版本。Prism ML以开源模型形式提供两个版本,分别为仅采用“-1/1”的“1-bit Bonsai Image 4B”,以及采用“-1/0/1”的“Ternary Bonsai Image 4B”。

从内存占用来看,原版FLUX.2 Klein 4B约需7.75GB;1-bit Bonsai Image 4B降至0.93GB,Ternary Bonsai Image 4B则为1.21GB。Prism ML表示,在模型大幅轻量化后,生成质量仍能维持较高水平,其中1-bit版本和三值版本的效果分别达到原版的88%和95%。

在使用方式上,Prism ML已在App Store推出iPhone免费应用“Bonsai Studio”。用户打开应用后下载模型,即可直接生成图片。Gigazine报道称,Bonsai三值模型的文件大小约为3.89GB。

生成速度方面,以iPhone Pro机型为例,生成一张512×512像素图片约需12秒。Gigazine还展示了使用“西兰花盆景、日式庭院、照片级写实”等提示词生成的案例,并表示动画风格图片和人物图片也可以通过相同方式生成。

除iPhone外,Bonsai Image 4B也可在Windows 11 PC和macOS环境中运行。Prism ML表示,相关模型已通过Hugging Face公开发布。

从此次发布来看,图像生成AI正进一步向智能手机本地运行推进。在内存占用被压缩至约1GB的同时,普通用户也能通过免费应用直接体验图像生成功能,端侧AI的竞争范围或正从文本生成加快延伸至图像生成领域。

关键词

#Prism ML #Bonsai Image 4B #Bonsai Studio #FLUX.2 Klein 4B #量化 #1-bit #三值量化 #端侧AI #iPhone #图像生成AI
版权所有 © DigitalToday。未经授权禁止转载或传播。