Workflow
BFL&Krea重磅开源新图像模型,专注于极致真实细节去 AI 感
歸藏的AI工具箱·2025-08-01 00:19

开源图像模型FLUX.1-Krea - Black Forest Labs与Krea合作开源了FLUX.1-Krea图像模型,专注于生成具有独特美感且无"AI效果"的自然细节图像 [1] - 该模型完全兼容现有的FLUX开源模型生态系统,并发布了详细的技术报告解释模型实现思路和训练过程 [1] - 模型训练目标是"制作看起来不像AI的AI图像",旨在解决当前AI图像常见的模糊背景、蜡质皮肤质感等问题 [11] AI风格问题分析 - 当前AI生成图像存在明显的"AI风格"问题,包括过于模糊的背景、蜡质皮肤质感和乏味构图等 [9] - 过度追求技术指标和基准优化导致早期图像模型的真实感、风格多样性和创造性融合被忽视 [10] - 现有评估基准主要关注提示词遵从性(空间关系、属性绑定等),而忽视了美学评估 [12] 模型训练方法 - 训练分为预训练和后训练两个阶段:预训练注重"模式覆盖"和"世界理解",后训练则聚焦美学优化 [17][20] - 预训练阶段使用包含"劣质"数据的多样化数据集,使模型能够理解负面提示词 [21] - 后训练采用监督微调(SFT)和基于人类反馈的强化学习(RLHF)两阶段方法 [28] - 后训练数据量少(<1M)但质量高,偏好标签由专业标注员精心收集 [31] 技术实现细节 - 使用flux-dev-raw作为基础模型,这是一个12亿参数的扩散变换器模型,具有丰富的世界知识和多样化输出能力 [26][27] - 在RLHF阶段采用TPO偏好优化技术,进行多轮优化以校准模型输出 [29] - 发现将模型过拟合到特定风格比使用"全球"用户偏好数据更有效 [32] - 模型下载和完整公告已发布在Hugging Face和公司官网 [33]