Workflow
凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”
量子位·2025-08-19 15:21

Qwen-Image-Edit核心功能 - 支持点对点图像编辑,包括精准文字修改、新增/消除/重绘元素、IP编辑、视角切换、风格迁移等生成式玩法 [2] - 采用语义与外观双重编辑技术,结合Qwen2-5-VL和VAEEncoder实现视觉语义控制与外观控制 [67] - 在公开基准测试中展现SOTA性能,成为强大的图像编辑基础模型 [69] 原创IP编辑能力 - 以吉祥物卡皮巴拉为原型生成系列衍生形象,保持角色特性同时实现场景化创新 [8][10] - 实测中成功将熊形象调整为体操运动员造型,细节处理精准(手指数量、单杠形变) [11][13] 视角转换技术 - 支持90度/180度多角度旋转,实测WRC小瓦力模型后侧视角转换效果惊艳 [14][16][17] - 对非标准主视图(含俯视角度)仍能保持主体结构完整性 [17][19] 虚拟形象生成 - 可生成动漫/007/恶魔等多风格头像,3D卡通风格下眼镜框细节保留但存在全框化倾向 [20][21][26] - 复杂画风(如热血漫画)会出现线条凌乱现象 [23] 元素新增与修改 - 在颐和园实景照片中添加木质指示牌并生成倒影,高分辨率输入时主动降低输出分辨率 [29][32][34] - 低分辨率漫画测试中效果更优,成功添加"欢迎来到大海"标牌 [37] AI消除与重绘 - 精准去除头发丝等细小元素,支持复杂场景中单一元素颜色修改(如字母a黄变橙) [39][43][45] - 电商场景模拟表现优异,模特换装时手部/头发/光影处理自然 [46][47] 文字编辑技术 - 支持中英文双语编辑,可修改海报大字及细小文字(如AICoding→AIAgent) [49][50][54] - 链式编辑实现书法作品逐字/偏旁级修正,避免整图重生成 [56][60][62] 技术实现特点 - 一次出图即可完成多类编辑,虽存在色调/细节轻微变化但整体效果达标 [64] - 同时满足low-level外观编辑(像素级不变)与high-level语义编辑(整体像素可变)需求 [69]