公司产品发布与功能升级 - 字节图像生成模型Seedream 5.0正式上线,已在视频编辑应用剪映、剪映海外版Capcut及字节AI创作平台小云雀上线,并在即梦AI平台开启灰度测试,图片生成可限时免费体验 [1] - 新模型支持2K分辨率图片直出和4K AI增强分辨率输出,升级点包括首次支持检索生图、提升提示词理解准确性、支持更细节精致的纹理生成,并允许用户精确调整图像 [3] - 模型新增三大能力:智能水平增强以生成细节精准、布局清晰、文本渲染更佳的图像;增强风格化效果,提供更清晰细节与精致纹理;提升智能推理能力,包括多步逻辑与空间理解 [9] 产品性能与市场定位 - 官方将Seedream 5.0与Nano Banana Pro对标,并强调其更便宜,目前所有用户可免费使用20次,美国地区后续上线 [3] - 在对比测试中,Seedream 5.0能理解“静谧科技感”等抽象提示词,生成效果更美观、多样化,但在抽象语义理解、文字渲染和复杂逻辑构图方面仍存在技术瓶颈 [3][28] - 相比于Seedream 4.5,新模型在整体排版和架构设计上更为美观,但生成效果很难说有跨越式提升,用户对小版本迭代的感知正在变弱 [3][26][28] 实测能力分析 - 在具体测试中,Seedream 5.0能为《静夜思》生成包含关键元素(如“举头望明月”)的古诗插图,但未涉及原诗中的“床前”等细节 [10] - 模型具备联网搜索能力,输入“最近有很多家机器人都要参加2026春晚,生成一张已官宣参加春晚的机器人海报”后,能生成视觉元素准确、文字无乱码的海报,但未完全理解“已官宣”的限定条件 [12] - 对于细致描述如“特写电影感肖像…”,模型能输出逆光效果到位、发丝光晕和前景柔焦自然的照片级真实感图像 [14] - 在根据参考图生成图片的测试中,上传《闪灵》男主图片后,模型能生成面部一致、手拿灯笼和对联的拜年图片 [19][20] 与竞品对比 - 在生成“解释在特拉普修道院制作啤酒的过程”信息图的对比中,Seedream 5.0的步骤解释最为详细,但艺术设计感相比Nano Banana Pro稍弱 [3][5] - 面对超难提示词“生成一个用左手写字的人,背景有一个显示5:25的模拟时钟”,Seedream 5.0与Nano Banana Pro均未完全成功,后者生成图片中人物握笔手为左手,时钟时间约为5:30 [22] - 社交平台反馈认为,Seedream 5.0的智能水平、中文能力有提升,但都比不上Nano Banana Pro [7] - 此次Seedream 5.0预览版的升级优先考虑的是智能水平而非美观,旨在应对复杂的知识驱动型任务 [5] 行业发展趋势 - 当前头部图像模型的迭代路径正朝着提升理解能力、可控生成、编辑精度等实用能力升级 [28] - Seedream 5.0选择在检索增强、细节纹理、精准调整、4K增强上做优化,生成结果没有颠覆性效果,这或许更贴近用户的实际需求 [28]
刚刚,Seedream 5.0上线,字节又一新模型
36氪·2026-02-10 14:56