文章核心观点 - 火山引擎发布了其图像生成模型豆包(Doubao)的最新版本Seedream-4.5,该模型在图像编辑、多图组合生成、创意设计等多个核心能力上实现了显著提升,并已面向企业和公众开放测试 [1][35] 新模型核心功能升级 - 强化原图保持能力:模型能够最大化保持原图的人脸、光影色调与画面细节,适用于精准的图像编辑(P图)[4] - 例如,可执行“只保留绿线中的人物”或“将白天变为黑夜”等复杂指令 [5][7] - 具备将图片中的英文转换为手写体中文的能力 [9] - 重点强化多图组合生成能力:能够精准执行复杂指令,将多张参考图中的元素识别提取并自然融合 [11][13] - 输入8张参考图并指定布局,可生成如童话故事书封面等复杂画面 [11] - 能够生成包含多个角色的无违和感群像画面或“大合照” [15][17] - 可根据一张参考图,一次性生成6张不同比例(如1:1、16:9等)的海报,并保持风格和元素不变 [19][20] - 优化海报排版与Logo设计能力:能够生成如高级香薰产品详情页、极简风艺术展宣传海报等设计作品 [27][31] - 具备强大的创意变体与风格迁移能力:例如,根据一张篮球创意图,可生成足球、排球、高尔夫、网球对应的创意图,且球体材质与内部结构精细真实 [22][23][25] 模型性能与测试表现 - 在内部多维度基准测试MagicBench上,Seedream-4.5相比上一代Seedream-4.0,在指令遵循、一致性、美学表现等多个维度均实现全面性能提升 [33] 产品公测与用户体验详情 - 开放状态:模型已面向企业全量开放API,并向用户开启公测 [35] - 试用方式:用户可在火山引擎AI体验中心注册登录,免费生成200张图片进行体验 [36] - 支持功能:支持文生图、图片编辑、参考图生图、组图生成 [37] - 生成模式与参数: - 组图生成提供自动模式、故事书、连环画三种模式可选 [38] - 生图分辨率支持2K、4K [38] - 可调整图片比例、尺寸,单次最多生成15张图片 [38] - 实测效果展示: - 图像修复与编辑:成功为模糊表情包角色更换蓬蓬公主裙泳衣,并提升清晰度 [40][42] - 图像细化与上色:能将多人物剪影细化绘制为全彩角色形象,添加服饰细节、材质质感与光影 [45][47][48] - 文字生成与转换:可将图片中的文字进行转换(如中文转英文)[50] - 多元素融合:能将多张图中的元素融合生成一张圣诞海报,准确捕捉细节 [51][53] - 复杂指令遵循:能根据超长的纯文本提示(描述北欧森林小镇场景),生成照顾到各种细节的图像 [57][58][59][60] - 用户反馈与官方建议: - 用户反馈其光影与环境调整能力出色,能自然融入如手持手机、佩戴耳机等新设定元素 [66][69] - 实测表明,模型在多元素融合、画质提升、主体元素一致性保持方面表现突出 [71] - 模型提示词理解力强,但更依赖清晰具体的描述,表达越明确生成越精准 [72] - 官方生图建议:使用简洁连贯的自然语言写明主体+行为+环境,并用短语补充风格、色彩、光影、构图等美学要求 [73]
实测完豆包Seedream 4.5,替我设计师朋友哭了
量子位·2025-12-07 17:00