FLUX.2
搜索文档
Nano Banana平替悄悄火了,马斯克、Meta争相合作
36氪· 2025-12-16 10:59
一家低调的德国AI初创公司,凭什么被誉为"AI生图界的DeepSeek"? 智东西12月15日报道,在Artificial Analysis的文生图榜单最新排名中,德国人工智能实验室Black Forest Labs的FLUX.2[pro]排名第二,仅次于 谷歌的Nano Banana Pro。轻量版FLUX.2[flex]则排名第四,在字节跳动Seedream 4.5之前。 | ﮨﮯ | Creator 1J | Model 14 | ELO 17 | 95% CI | Appearances îJ | Release Date 1+ | | --- | --- | --- | --- | --- | --- | --- | | 1 G Google | | Nano Banana Pro (Gemini 3 Pro Image) | 1,223 | -10/+10 | 5,921 | Nov 2025 | | 2 | & Black Forest Labs | FLUX.2 [pro] | 1,195 | -10/+11 | 4,852 | Nov 2025 | | ന | In ByteDance Se ...
Nano Banana平替悄悄火了!马斯克、Meta争相合作
搜狐财经· 2025-12-15 18:57
| 7 | Creator 14 | Model 17 | ELO 1. | 95% CI | Appearances 1J | Release Date 14 | | --- | --- | --- | --- | --- | --- | --- | | 1 G Google | | Nano Banana Pro (Gemini 3 Pro Image) | 1,223 | -10/+10 | 5,921 | Nov 2025 | | 2 | & Black Forest Labs | FLUX.2 [pro] | 1,195 | -10/+11 | 4,852 | Nov 2025 | | ന | In ByteDance Seed | Seedream 4.0 | 1,193 | -6/+6 | 16,805 | Sept 2025 | | | & Black Forest Labs | FLUX.2 [flex] 0 | 1,182 | -11/+11 | 4,841 | Nov 2025 | | ន | Iil ByteDance Seed | Seedream 4.5 | 1,170 | -9 ...
BFL 创立一年估值 32.5 亿美金,AI 原生版 Dropbox 来了
投资实习所· 2025-12-02 13:12
产品传播与商业转化 - 图片和视频的传播效果良好 但长期持续使用取决于能否转化为生产力工具或帮助企业及用户赚钱的产品[1] - OpenAI的Sora早期获得大量自发传播 但近期用户使用量已大幅下跌 表明即使是知名公司单独推出新产品也存在挑战[2] - Google将Nano Banana能力整合到现有产品中是明智做法 单独推出产品希望不大[2] Elevenlabs财务表现 - 语音AI公司Elevenlabs过去12个月收入达到1.93亿美元 其中50%来自思科和Twilio等企业客户 另外50%来自YouTuber、播客主播和作家等早期用户[2] - 公司已经实现盈利 利润率约为60%[2] Black Forest Labs融资与估值 - AI图片生成创业公司Black Forest Labs完成3亿美元B轮融资 估值达到32.5亿美元[3] - 公司成立于2024年8月 估值增长迅速[3] - 融资由Salesforce Ventures和Anjney Midha联合领投[3] BFL技术愿景与定位 - 公司致力于构建像素级前沿模型 创造相机无法捕捉的画面 开发理解意图而不仅仅是执行提示的系统[3] - 长期目标是统一视觉感知、生成、记忆和推理 为视觉智能奠定基础[3] - 定位为模型企业 不直接推出面向用户的产品 而是通过API与Adobe、Canva、Meta和微软等公司合作[6] BFL团队背景与技术策略 - 三位联合创始人都是Stable Diffusion系列模型的原始共同创作者 也是潜在扩散模型的先驱[4] - 其研究成果为开源图像生成社区奠定基石 并影响了DALL-E 2/3和Sora等闭源模型的架构[4] - 采用开放权重方式发布核心模型FLUX.2 允许研究人员和开发者免费使用、定制和部署[6] - 技术成为Hugging Face上最受欢迎的图像模型之一 成功将研究成果转化为生产力工具[6] AI原生存储产品 - 有团队开发AI原生版Dropbox 种子轮融资近800万美元[6] - 与Google Drive和Dropbox基于文本的AI搜索不同 该产品愿景是成为文件操作系统 从存储优先变为理解优先[7] - 团队从零开始构建完全不同的技术架构[7]
6B文生图模型,上线即登顶抱抱脸
量子位· 2025-12-01 12:26
模型发布与市场表现 - 阿里通义发布全新6B参数图像生成模型Z-Image,首日下载量高达50万次 [1] - 模型上线不到两天即登顶HuggingFace两个榜单第一 [1] - 模型虽小但出图质量不输同期发布的FLUX.2,在画质、文本、推理等方面达到SOTA级别 [3] 模型版本与技术特点 - Z-Image-Turbo版本已开源,参数量约6B,在写实风格图像生成和中英文文本精准渲染方面表现较好 [8] - Z-Image-Edit版本针对图像编辑任务微调,可上传图片并通过自然语言指令进行精确修改 [8] - Z-Image-Base版本为未压缩的完整基础模型,面向开发者和研究者 [8] - 模型采用可扩展的单流DiT架构,将文本token、视觉语义token和图像VAE token统一处理,减少参数冗余和计算浪费 [35] - 通过Decoupled-DMD蒸馏技术,仅需8次函数评估即可生成高清图像,大幅提升速度 [39][40] 图像生成能力评估 - 在真实感和美学处理上表现出色,能生成具有电影级真实感的场景和接近专业影棚级的写实肖像照 [11][14] - 具备较强的文字处理能力,能较好处理一级标题的渲染,但小字号文字仍存在变形问题 [18][19] - 语义理解能力到位,能根据指令生成符合要求的科普漫画内容 [20][22] - 用户生成内容涵盖复古电影质感大片、微观迷你世界场景、显微镜级别昆虫特写等,展示模型多样化应用潜力 [24][27][30] 性能优势 - 模型架构优化和蒸馏技术结合,在不牺牲质量的前提下大幅减少计算量,实现高效运行 [34][43] - 网友反馈模型能流畅运行在个人电脑上且不烧显卡,凸显其易用性和低资源消耗优势 [7]
FLUX.2开源了,但是我好像也看到了小公司的无力。
数字生命卡兹克· 2025-11-26 09:20
公司产品发布 - FLUX公司发布了4款基础模型和1个VAE模型,其中Pro和Flex两款最强大的模型为闭源,另有一款蒸馏模型klein即将开源 [8][9][11] - 开源模型链接已发布在Hugging Face上,用户可通过其官网或liblibai平台使用该模型 [11][12][13] 产品性能对比:图像生成 - 在相同提示词下,FLUX.2生成的图像效果与Nano Banana Pro存在显著差距,例如在“人类考古学家发现旋转金属球”和“日常松弛感亚洲美女”等场景中,后者在真实感和细节上表现更优 [15][16][17][18][20] - 在生成具有特定风格要求的图像时,如“《龙珠Z》神龙”的彩色铅笔风格和“《天书奇谭》”中国山水画风格海报,FLUX.2的表现亦不如对手 [22][24] 产品性能对比:指令理解与编辑 - 在“用嘴改图”功能上,FLUX.2表现不佳,例如在要求“让左边人物cosplay右边角色”的指令下,其生成结果与预期偏差巨大 [28][29][31][32][34] - 在将动漫人物“变成真人照片”的指令中,FLUX.2的生成效果同样不理想 [37][38] 核心竞争差距:世界知识 - 产品性能的根本差距源于底层模型的世界知识差异,Nano Banana Pro背后是Gemini 3 Pro多模态大模型,而FLUX.2使用的是Mistral-3 24B模型 [41][42][44] - 在需要深度领域知识的任务中,如生成“海贼王战力排名信息图”,Nano Banana Pro能准确理解并呈现内容,而FLUX.2则显示出对内容的不理解 [48][49][51][52] - 在处理包含多个跨动漫、文化角色的复杂提示词时,Nano Banana Pro能几乎全对地生成集体大合照,而FLUX.2则生成乱码,显示出其在世界知识上的严重短板 [54][55][57][60][61] 行业趋势分析 - 当前AI绘图领域的竞争已从单纯的图像生成质量转向对世界模型的认知能力,这需要模型具备从海量多模态数据中学习的世界知识 [75][76][77][78][79] - 大厂凭借其在数据、算力和人才密度上的绝对资源优势,正对中小型模型公司形成“降维打击”,行业壁垒日益增高 [64][65][80][81][90] - 尽管FLUX.2等开源模型为中小企业和开发者提供了宝贵的火种和基石,具有重要价值,但其技术理想主义在绝对的资源壁垒面前显得脆弱 [82][83][84][85][86][91]