公司产品发布 - FLUX公司发布了4款基础模型和1个VAE模型,其中Pro和Flex两款最强大的模型为闭源,另有一款蒸馏模型klein即将开源 [8][9][11] - 开源模型链接已发布在Hugging Face上,用户可通过其官网或liblibai平台使用该模型 [11][12][13] 产品性能对比:图像生成 - 在相同提示词下,FLUX.2生成的图像效果与Nano Banana Pro存在显著差距,例如在“人类考古学家发现旋转金属球”和“日常松弛感亚洲美女”等场景中,后者在真实感和细节上表现更优 [15][16][17][18][20] - 在生成具有特定风格要求的图像时,如“《龙珠Z》神龙”的彩色铅笔风格和“《天书奇谭》”中国山水画风格海报,FLUX.2的表现亦不如对手 [22][24] 产品性能对比:指令理解与编辑 - 在“用嘴改图”功能上,FLUX.2表现不佳,例如在要求“让左边人物cosplay右边角色”的指令下,其生成结果与预期偏差巨大 [28][29][31][32][34] - 在将动漫人物“变成真人照片”的指令中,FLUX.2的生成效果同样不理想 [37][38] 核心竞争差距:世界知识 - 产品性能的根本差距源于底层模型的世界知识差异,Nano Banana Pro背后是Gemini 3 Pro多模态大模型,而FLUX.2使用的是Mistral-3 24B模型 [41][42][44] - 在需要深度领域知识的任务中,如生成“海贼王战力排名信息图”,Nano Banana Pro能准确理解并呈现内容,而FLUX.2则显示出对内容的不理解 [48][49][51][52] - 在处理包含多个跨动漫、文化角色的复杂提示词时,Nano Banana Pro能几乎全对地生成集体大合照,而FLUX.2则生成乱码,显示出其在世界知识上的严重短板 [54][55][57][60][61] 行业趋势分析 - 当前AI绘图领域的竞争已从单纯的图像生成质量转向对世界模型的认知能力,这需要模型具备从海量多模态数据中学习的世界知识 [75][76][77][78][79] - 大厂凭借其在数据、算力和人才密度上的绝对资源优势,正对中小型模型公司形成“降维打击”,行业壁垒日益增高 [64][65][80][81][90] - 尽管FLUX.2等开源模型为中小企业和开发者提供了宝贵的火种和基石,具有重要价值,但其技术理想主义在绝对的资源壁垒面前显得脆弱 [82][83][84][85][86][91]
FLUX.2开源了,但是我好像也看到了小公司的无力。
数字生命卡兹克·2025-11-26 09:20