RedEdit Bench
搜索文档
这个春节P图不求人!小红书开源图像编辑新SOTA
量子位· 2026-02-12 19:00
FireRed-Image-Edit模型发布 - 小红书基础模型FireRed-Image-Edit正式亮相,在AI生图领域展现出强劲实力 [2][3] - 该模型在处理复杂编辑指令、风格化转换及高精度文字编辑等多个核心指标上表现超强,在多项权威测试中达到业界领先水平 [3] - 项目代码、技术报告和demo网页已开源,模型权重也即将在未来几天开源 [6] 模型性能与技术优势 - 模型在ImgEdit、GEdit等多个榜单中取得了SOTA结果,凭借更精准的理解力、更强的ID保持度及高效的架构脱颖而出 [3] - 其高效架构背后的技术底座来自小红书Super Intelligence Team在图像生成与编辑领域的重要探索 [5] - 模型通过一套数据引擎与三阶段训练逻辑构建,包括预训练、微调和强化学习阶段,以提升指令泛化理解能力和训练效率 [13][16] 评测标准与数据构建 - 团队推出了RedEdit Bench深度评测方案,包含15个子任务,覆盖画面增删改、人像美化、低画质增强等高频实战场景 [9] - 该Bench对编辑模型通用能力的评估精度相比ImgEdit和GEdit更高,并计划开源以为开源社区建立新维度的评估标准 [10][11] - 模型构建了图像编辑数据生产引擎,通过三条路径规模化产出训练对,并采用“检查—补齐”流程解决长尾任务样本稀缺问题,确保数据质量 [13][14] 核心功能与能力展示 - 模型具备强大的指令遵循一致性,通过随机指令对齐机制使模型能真正理解语义与图像的对应关系 [18][20] - 在文字编辑方面,创新性地提出了Layout-Aware OCR-based Reward,在强化学习阶段惩罚错别字、字符错位、大小异常和布局崩坏,以提升文字编辑准确性并保持原始风格 [26][27][28] - 模型支持创造力场景生成和多参考图生成,包括风格迁移或多图融合,并能将超分、去模糊、去噪及光影增强等底层视觉任务统一纳入指令微调,实现一键画质调整 [33][44] 未来计划与社区贡献 - 公司计划后续进一步提升基础模型在人像美化、一致性、文字上的编辑能力 [49] - 将在未来几个月内持续开源更新版本和文生图基座模型 [49] - 通过开源FireRed-Image-Edit,公司希望为社区提供一个高效、可控、高质量的基座 [48]