画像=Microsoft。速度やコスト、表現の違いに応じて画像生成モデルを使い分ける構成を示した。

Microsoftは15日、画像生成AIモデル「MAI-Image-2-Efficient」を発表した。既存の「MAI-Image-2」と同じアーキテクチャをベースにしながら、高速化と低コスト化を図った効率重視モデルで、企業の業務利用やサービスへの組み込みを想定する。

オンラインメディアGigazineによると、同モデルはMicrosoftが3月19日に発表した「MAI-Image-2」の改良版に当たる。NVIDIA H100で1024×1024画像を生成する場合、従来モデル比で最大22%高速に処理でき、コストは41%低減したとしている。Microsoftは、上位モデル並みの品質を維持したまま運用効率を高めた点を特徴に挙げている。

生成される画像の傾向にも違いがある。Microsoftによれば、新モデルはシャープで明瞭な線を描きやすく、イラストやアニメーション、目を引く写実的な画像の生成に向く。一方、既存の「MAI-Image-2」は滑らかで緻密な描写を強みとしており、用途に応じた使い分けを想定している。

競合モデルとの比較でも、Microsoftは生成速度の優位性を打ち出した。1メガピクセル画像の生成時間を比較した資料では、「Gemini 3 Pro Image」「Gemini 3.1 Flash Image」「GPT-Image-1.5-High」より高速に生成できるとしている。速度とコストの両面を訴求し、画像生成AIを業務ツールや各種サービスに組み込みたい企業需要の取り込みを狙う。

「MAI-Image-2-Efficient」は現在、「Microsoft Foundry」と「MAI Playground」で利用できる。Microsoft FoundryでのAPI料金は、テキスト入力が100万トークン当たり5ドル、画像出力が100万トークン当たり19.5ドル。あわせてモデルカードも公開し、仕様や利用条件を確認できるようにした。

キーワード

#Microsoft #画像生成AI #MAI-Image-2-Efficient #MAI-Image-2 #NVIDIA H100 #Microsoft Foundry #MAI Playground #API
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.