画像=Qwen

Alibabaの研究チームは、画像生成AIモデル「Qwen-Image-2.0」を発表した。従来の「Qwen-Image」と「Qwen-Image-Edit」を統合し、画像生成と編集を単一モデルで扱えるようにしたのが特徴だ。実写表現に加え、文字入り画像の生成性能も強化した。

Qwen-Image-2.0は、ブラインドテスト形式の評価サービス「AI Arena」で、テキストからの画像生成と画像編集の両部門で高い評価を得たという。

テキストから画像を生成する分野では「Gemini-2.5-Flash Image Preview」を上回り、画像編集では同モデルと同水準の性能を示したとしている。

機能面では、最大1000トークンの入力に対応。プロンプトでレイアウトや構図を細かく指定できるほか、スライド形式の画像生成にも対応する。

対応する表現の幅も広い。実写画像、長文テキストを含む画像、ポスター、情報量の多いスライドなどを生成でき、コマ割りやセリフ、構図を指定した漫画生成機能も備える。

編集機能も拡充した。人物写真1枚から複数のポーズ画像を生成したり、異なる写真の被写体を1つのシーンに合成したりできるという。

現在、Qwen-Image-2.0は「Qwen Chat」で利用できる。一方、従来のQwen-Imageシリーズはオープンモデルとして公開されていたものの、今回のモデルは現時点でダウンロードには対応していない。

AlibabaはQwen-Image-2.0によって、画像生成と編集に加え、文字入り画像制作まで対応範囲を広げた。Googleの「Nano Banana」と並ぶ水準の結果を示したとされることで、画像生成モデルを巡る競争がさらに激しくなる可能性がある。

キーワード

#Alibaba #生成AI #画像生成AI #Qwen-Image-2.0 #Qwen Chat #AI Arena
Copyright © DigitalToday. All rights reserved. Unauthorized reproduction and redistribution are prohibited.