图片来源:Qwen

Alibaba研究团队发布新一代图像生成模型Qwen-Image-2.0,整合了Qwen-Image与Qwen-Image-Edit两项能力,重点强化写实图像生成,并针对文字图片生成进行了优化。

据日媒Gigazine 12日报道,Qwen-Image-2.0在Alibaba旗下AI盲测平台AI Arena的文生图和图像编辑两项测试中均获得较高评价。其中,该模型在文生图赛道上的表现超过Gemini-2.5-Flash Image Preview(Nano Banana),在图像编辑赛道上的表现也接近后者。

从功能来看,Qwen-Image-2.0支持最长1000 token输入,用户可在提示词中更细致地控制画面布局,同时支持幻灯片页面生成和漫画创作。模型适用范围覆盖写实图像、长文本图片、海报以及信息密度较高的幻灯片等多种内容形态。

在图像编辑方面,Qwen-Image-2.0的能力也有所增强。用户上传一张人物照片后,可生成不同姿势的图像;也可以将不同照片中的主体合成至同一场景。

目前,Qwen-Image-2.0已可通过Qwen Chat使用。此前,Qwen-Image系列曾以开放模型形式推出,但Qwen-Image-2.0暂未开放下载。

Alibaba表示,新模型进一步拓展了图像生成和图像编辑能力,并将支持范围延伸至文字图片生成。随着Qwen-Image-2.0被认为可输出与Google重点推广的Nano Banana相近的效果,图像生成模型领域的竞争或将进一步升温。

关键词

#Alibaba #Qwen-Image-2.0 #Qwen Chat #AI Arena #AI图像生成 #文生图 #图像编辑 #文字图片生成 #Google
版权所有 © DigitalToday。未经授权禁止转载或传播。