Alibabaグループは4月2日、画像生成・編集向けAIモデル「Wan 2.7 Image」を公開した。従来の画像生成AIで課題とされてきた画風の画一化や色再現のばらつきを改善し、キャラクター表現の細かな調整に対応する。あわせて、4K出力に対応した上位のプロモデルも公開した。
Wan 2.7 Imageでは、骨格や目の形状などの細部を調整でき、用途に応じて差別化したキャラクターを作成できるという。
「カラーパレット」機能では、特定のカラーコードと比率をプロンプトに入力することで、ブランドカラーを忠実に反映できるとしている。
テキストレンダリング性能も高めた。最大3000トークンのテキスト入力に対応し、12言語で学術文書のテキストや複雑な数式、表を印刷に耐える品質で生成できるという。
最大9枚の参照画像を利用できるほか、1回で最大12枚の画像を生成するバッチ処理機能も備えた。
「クリック編集」インターフェースでは、画像内の特定領域を選択し、要素の追加や移動、整列をピクセル単位で行える。
同時に公開したプロモデルは、画像構成の安定性やプロンプト理解を高めるとともに、高解像度の4K出力に対応する。両モデルは今後、AIアプリケーション「Qwen」アプリにも統合する予定だ。
著者について