画像=GIGAZINE

Prism MLは、iPhoneでローカル動作する軽量画像生成AIモデル「Bonsai Image 4B」を公開した。1ビットおよび3値化の手法でメモリ使用量を約1GBまで抑えたのが特徴で、無料アプリ「Bonsai Studio」を通じて利用できる。

米オンラインメディアのGIGAZINEは27日(現地時間)に報じた。ベースとなる既存モデル「FLUX.2 Klein 4B」を軽量化し、スマートフォンでも動作するようメモリ負荷を大きく引き下げたという。

今回の公開は、オンデバイスAI開発が活発化する流れの中で打ち出された。Prism MLはこれまで、AIモデルを「-1」と「1」の2値、あるいは「-1」「0」「1」の3値で表現する量子化手法を用い、メモリ使用量を抑える技術を開発してきた。4月には、iPhoneで動作する80億パラメータの言語モデル「1-bit Bonsai 8B」も披露している。

今回公開した「Bonsai Image 4B」は、「FLUX.2 Klein 4B」を再学習したモデルだ。Prism MLは、「-1」と「1」のみを使う「1-bit Bonsai Image 4B」と、「-1」「0」「1」に基づく「Ternary Bonsai Image 4B」の2モデルをオープンモデルとして公開した。

メモリ使用量は大幅に削減した。元の「FLUX.2 Klein 4B」が約7.75GBだったのに対し、「1-bit Bonsai Image 4B」は0.93GB、「Ternary Bonsai Image 4B」は1.21GBまで圧縮した。Prism MLによると、軽量化後も生成品質は一定水準を維持しており、社内基準では元モデル比で1ビットモデルが88%、3値モデルが95%の品質だという。

利用方法も比較的シンプルだ。Prism MLはiPhone向け無料アプリ「Bonsai Studio」をApp Storeで配布しており、ユーザーはアプリ起動後にモデルをダウンロードして画像を生成できる。GIGAZINEによると、3値モデルのファイルサイズは約3.89GBだった。

生成速度も明らかにした。iPhone 17 Proでは、512×512ピクセルの画像1枚を約12秒で生成したという。GIGAZINEは「ブロッコリーの盆栽、日本式庭園、フォトリアル」といったプロンプトを入力し、意図に沿った画像を生成した事例を紹介した。アニメ調の画像や人物画像も同様の手順で生成できたとしている。

同モデルはiPhone専用ではない。Prism MLは、Windows 11搭載PCとmacOS環境でも実行できると説明している。モデルはHugging Faceで公開している。

スマートフォン上で、ネットワーク接続なしに画像生成AIを動かせる水準まで軽量化が進んだことを示す事例といえそうだ。メモリ使用量を約1GB前後に抑えながら、一般ユーザーが無料アプリで直接試せる点も注目される。オンデバイスAIの競争は、テキスト生成に加えて画像生成の領域にも広がりつつある。

キーワード

#Prism ML #Bonsai Image 4B #オンデバイスAI #1ビット #3値化 #iPhone #画像生成AI #Hugging Face #Bonsai Studio
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.