图像创作模型
搜索文档
火山引擎:Seedream 5.0 Lite上线 首次支持联网检索
第一财经· 2026-02-13 12:44
公司产品发布 - 火山引擎于2月13日正式上线豆包图像创作模型5.0 Lite(Doubao-Seedream-5.0-Lite)至火山方舟体验中心 [1] - 该模型的API服务计划于二月中下旬在火山方舟上线 [1] 产品性能提升 - 相比4.5版本,豆包图像创作模型5.0 Lite在跨模态理解与推理、精准指令遵循、联网实时检索三大能力上实现全面提升 [1] - 模型首次支持实时检索增强能力,可通过联网检索获取最新知识和资讯,以更精准地回应具有时效性的创作需求 [1]
实测完豆包Seedream 4.5,替我设计师朋友哭了
新浪财经· 2025-12-07 23:06
公司产品发布 - 火山引擎发布图像创作模型Doubao-Seedream-4.5,作为豆包升级的一部分 [1][52] - 新模型已面向企业全量开放API使用,并向用户开启公测 [26][77] 核心功能升级 - 强化原图保持能力,最大化保持原图的人脸、光影与色调、画面细节,可用于P图 [3][54] - 重点强化多图组合生成能力,能根据输入的多张参考图和布局指令生成复杂画面 [3][55] - 优化海报排版与Logo设计能力,能设计产品详情页和宣传海报 [17][68] 技术能力与性能 - 在内部基准测试MagicBench上,Seedream 4.5在指令遵循、一致性、美学表现等多个维度相比上一代4.0全面提升 [24][75] - 能精准执行复杂指令,将多种元素精准识别提取并自然融合 [6][57] - 展现很强的风格迁移与材质重建能力,例如根据一张篮球图生成其他球类的对应创意图 [13][64] - 能够保持风格和元素不变,灵活调整构图与元素排布 [11][62] - 具备强大的指令遵循能力,能处理超长的纯文本提示并照顾到各种细节 [39][40][90][91] 产品实测与用户体验 - 在火山引擎AI体验中心可试用,注册登录后可免费生成200张图片 [27][78] - 支持文生图、图片编辑、参考图生图、组图生成 [27][78] - 组图生成有自动模式、故事书、连环画三种模式可选 [27][78] - 生图分辨率支持2K、4K,可调整图片比例、尺寸,单次最多生成15张图片 [27][78] - 实测显示其在多元素融合、画质提升、主体元素一致性保持方面表现突出 [50][101] - 网友实测反馈其光影与环境调整能力出色,能自然融入新设定的动作元素 [43][48][94][99] - 模型提示词理解力强,但更依赖清晰具体的描述,官方提供了详细的生图建议 [50][101] 应用场景展示 - 可用于修图,如在保持其他元素不变的前提下为角色成功换衣并提升清晰度 [29][31][80][82] - 可将简笔草图或剪影细化并绘制为全彩、带细节质感的角色形象 [34][85] - 具备文字生成能力,可将图片中的文字转换成其他语言 [35][86] - 能将多张图中的元素融合生成一张海报(如圣诞海报) [37][88] - 可根据一张参考图,一次性生成6张不同比例(1:1、2:3、4:3、16:9、1:2、9:16)的海报 [10][61] - 能生成无违和感的群像画面或让多个角色“拍”大合照 [8][9][59][60]
实测完豆包Seedream 4.5,替我设计师朋友哭了
量子位· 2025-12-07 17:00
文章核心观点 - 火山引擎发布了其图像生成模型豆包(Doubao)的最新版本Seedream-4.5,该模型在图像编辑、多图组合生成、创意设计等多个核心能力上实现了显著提升,并已面向企业和公众开放测试 [1][35] 新模型核心功能升级 - **强化原图保持能力**:模型能够最大化保持原图的人脸、光影色调与画面细节,适用于精准的图像编辑(P图)[4] - 例如,可执行“只保留绿线中的人物”或“将白天变为黑夜”等复杂指令 [5][7] - 具备将图片中的英文转换为手写体中文的能力 [9] - **重点强化多图组合生成能力**:能够精准执行复杂指令,将多张参考图中的元素识别提取并自然融合 [11][13] - 输入8张参考图并指定布局,可生成如童话故事书封面等复杂画面 [11] - 能够生成包含多个角色的无违和感群像画面或“大合照” [15][17] - 可根据一张参考图,一次性生成6张不同比例(如1:1、16:9等)的海报,并保持风格和元素不变 [19][20] - **优化海报排版与Logo设计能力**:能够生成如高级香薰产品详情页、极简风艺术展宣传海报等设计作品 [27][31] - **具备强大的创意变体与风格迁移能力**:例如,根据一张篮球创意图,可生成足球、排球、高尔夫、网球对应的创意图,且球体材质与内部结构精细真实 [22][23][25] 模型性能与测试表现 - 在内部多维度基准测试MagicBench上,Seedream-4.5相比上一代Seedream-4.0,在指令遵循、一致性、美学表现等多个维度均实现全面性能提升 [33] 产品公测与用户体验详情 - **开放状态**:模型已面向企业全量开放API,并向用户开启公测 [35] - **试用方式**:用户可在火山引擎AI体验中心注册登录,**免费生成200张**图片进行体验 [36] - **支持功能**:支持文生图、图片编辑、参考图生图、组图生成 [37] - **生成模式与参数**: - 组图生成提供**自动模式、故事书、连环画**三种模式可选 [38] - 生图分辨率支持**2K、4K** [38] - 可调整图片比例、尺寸,单次最多生成**15张**图片 [38] - **实测效果展示**: - **图像修复与编辑**:成功为模糊表情包角色更换蓬蓬公主裙泳衣,并提升清晰度 [40][42] - **图像细化与上色**:能将多人物剪影细化绘制为全彩角色形象,添加服饰细节、材质质感与光影 [45][47][48] - **文字生成与转换**:可将图片中的文字进行转换(如中文转英文)[50] - **多元素融合**:能将多张图中的元素融合生成一张圣诞海报,准确捕捉细节 [51][53] - **复杂指令遵循**:能根据超长的纯文本提示(描述北欧森林小镇场景),生成照顾到各种细节的图像 [57][58][59][60] - **用户反馈与官方建议**: - 用户反馈其光影与环境调整能力出色,能自然融入如手持手机、佩戴耳机等新设定元素 [66][69] - 实测表明,模型在多元素融合、画质提升、主体元素一致性保持方面表现突出 [71] - 模型提示词理解力强,但更依赖清晰具体的描述,表达越明确生成越精准 [72] - 官方生图建议:使用简洁连贯的自然语言写明**主体+行为+环境**,并用短语补充风格、色彩、光影、构图等美学要求 [73]