搜索关键词 复杂场景
AI & Enterprise
OpenAI推ChatGPT Images 2.0:复杂人群插画测试中表现突出
OpenAI推出新图像生成功能ChatGPT Images 2.0。软件工程师Simon Willison围绕“在人群中找出一只拿着业余无线电对讲机的浣熊”这一提示词,对多款模型进行了对比测试。结果显示,ChatGPT Images 2.0在细节呈现和目标识别方面优于gpt-image-1、Claude Opus 4.7以及Nano Banana 2、Nano Banana Pro,生成单张图片的成本约为0.4美元(约使用13342个输出Token)。
AI & Enterprise
Netflix开源视频修复模型VOID:可删去目标并重建后续画面
Netflix发布并开源视频对象删除与修复模型VOID。该模型可在移除视频中的特定目标后,进一步生成符合物理规律的后续画面,并可清除碰撞碎片、烟雾、火焰或水花等连带痕迹。目前,VOID已上线Hugging Face;在一项面向25人的偏好测试中,其支持率达到64.8%。
AI & Enterprise
Google “Nano Banana 2”实测:物理逻辑与文本渲染能力提升
外媒TechRadar对Google图像生成模型“Nano Banana 2”进行了5项测试,重点考察物理逻辑、材质呈现、复杂场景构图以及多语种文本渲染能力。测试结果显示,该模型在曲面文字可读性、反射与质感统一性,以及多行文字的拼写和排版稳定性方面表现较为突出,但最终生成效果仍高度依赖提示词设计和反复调整。