Workflow
FLUX.2
icon
搜索文档
Nano Banana平替悄悄火了,马斯克、Meta争相合作
36氪· 2025-12-16 10:59
公司核心技术与市场地位 - 德国人工智能实验室Black Forest Labs开发的FLUX系列图像生成模型在权威基准测试中表现卓越 其FLUX.2[pro]在Artificial Analysis文生图榜单中排名第二 ELO得分为1,195 仅次于谷歌的Nano Banana Pro (1,223分) 其轻量版FLUX.2[flex]排名第四 (1,182分) 领先于字节跳动的Seedream 4.5 (1,170分) [1][2] - 在另一评测平台LMarena的文生图榜单中 FLUX.2[flex]与谷歌Gemini 2.5 Flash Image以1,156分并列第四 FLUX.2[pro]和FLUX.2[dev]分别以1,151分和1,149分位列第六和第七名 [3] - FLUX.2模型是开源的 在Hugging Face上的下载量已达到225,346次 在图生图模型排名中位列第二 [3] - 公司联合创始人兼首席执行官Robin Rombach是潜在扩散模型技术的核心发明者 其论文《High-resolution image synthesis with latent diffusion models》被引用超过27,039次 该技术是Stable Diffusion模型的基础 [12][13][14] 公司融资与估值 - 公司于2024年8月成立 迄今累计融资额超过4.5亿美元 [7] - 2025年12月1日 公司完成B轮融资 筹集3亿美元 投后估值达到32.5亿美元 估值在一年多时间里增长了三倍 [7][22] - B轮融资由Salesforce Ventures和Anjney Midha联合领投 参与方包括a16z 英伟达 Northzone Creandum Earlybird VC BroadLight Capital General Catalyst 淡马锡 贝恩资本风险投资公司 Air Street Capital Visionaries Club等知名机构 以及合作伙伴Canva和Figma Ventures [22] 商业合作与财务表现 - 公司与多家科技巨头达成重要商业合作 包括与Meta签署了一份价值1.4亿美元的多年度合同 其中第一年支付3,500万美元 第二年支付1.05亿美元 [16] - 公司成立之初即与马斯克旗下的xAI合作 为其Grok聊天机器人提供AI图像生成功能 [10][16] - 公司已与Adobe Canva和Snap等行业知名企业签署合作协议 若计入与Meta的协议 总合同价值约达3亿美元 [19] - 截至2025年8月 公司的年度经常性收入已达到9,630万美元 并预计在2026财年将攀升至3亿美元 [19] 产品迭代与技术创新 - 公司于2025年11月发布了最新图像生成模型FLUX.2 该模型优化了文本和图像渲染表现 支持以多达10张图像作为参考 并可生成最高4K分辨率的图像 [20] - 此前于2025年5月发布的FLUX.1 Kontext模型 首次引入文本与图像双输入机制 支持上下文感知的生成与编辑 并采用了流匹配技术 [20] - 公司的技术根基源于其创始团队在潜在扩散模型领域的开创性研究 并致力于开发更高效的算法以在消费级硬件上获得出色性能 [14] 公司战略与文化 - 公司将总部设在德国弗赖堡 旨在远离硅谷的炒作氛围以保持团队在研发上的极度专注 [24] - 公司核心战略包括:通过开源部分FLUX模型赢得开发者社区认可并保持成本优势 将新融资重点投入计算基础设施升级与商业团队扩充 以及直面谷歌和字节跳动等巨头的竞争 立志在从广告到好莱坞的颠覆性市场中占据一席之地 [24] - 公司规模已从最初的10人扩展到50名全职员工 并在旧金山设有办事处 [24] - 公司积极在创意产业建立信任 在早期投资者帮助下于好莱坞开拓人脉 并强调其目标是增强创作者能力而非取代现有事物 [25]
Nano Banana平替悄悄火了!马斯克、Meta争相合作
搜狐财经· 2025-12-15 18:57
公司技术实力与市场地位 - 在Artificial Analysis的文生图榜单中,公司旗舰模型FLUX.2[pro]以ELO评分1,195分排名第二,仅次于谷歌的Nano Banana Pro(1,223分)[2][3] - 公司轻量版模型FLUX.2[flex]在Artificial Analysis榜单排名第四(ELO 1,182分),在LMarena榜单以1,156分与谷歌Gemini 2.5 Flash Image打成平手,位列第四[2][3][4][5] - 公司模型FLUX.2[pro]和FLUX.2[dev]在LMarena榜单分别排名第六(1,151分)和第七(1,149分)[4][5] - 公司开源模型在Hugging Face上的下载量已达到225,346次,在图生图模型排名中位列第二[5] - 公司联合创始人兼首席执行官Robin Rombach是潜在扩散(latent diffusion)技术的核心发明人,其关键论文《High-resolution image synthesis with latent diffusion models》被引用27,039次,总被引量达44,880次[12][13] 公司融资与估值 - 公司于2024年8月成立,迄今累计融资超4.5亿美元(约合人民币31.8亿元)[8] - 公司于12月1日完成3亿美元(约合人民币21.2亿元)的B轮融资,估值达32.5亿美元(约合人民币229.6亿元),估值在一年多时间里增长三倍[8][22] - B轮融资由Salesforce Ventures和Anjney Midha联合领投,投资方包括a16z、英伟达、Northzone、Creandum、General Catalyst、淡马锡、贝恩资本等知名机构,以及合作伙伴Canva和Figma Ventures[22] 公司商业合作与收入 - 公司与Meta签署了一份价值1.4亿美元(约合人民币9.9亿元)的多年度合同,第一年支付3,500万美元(约合人民币2.5亿元),第二年支付1.05亿美元(约合人民币7.4亿元)[15][16] - 公司早期与马斯克旗下xAI的Grok合作推出AI图像生成功能,借此打开市场知名度[15][16][19] - 公司已与Adobe、Canva和Snap等行业知名企业签署合作协议,加上与Meta的协议,总合同价值约达3亿美元[19] - 截至今年8月,公司年度经常性收入已达9,630万美元(约合人民币6.8亿元),并预计在2026财年攀升至3亿美元(约合人民币21.2亿元)[19] 公司产品与技术发展 - 公司核心产品为FLUX系列AI图像生成模型,最新版本FLUX.2优化了文本和图像渲染,支持以多达10张图像作为参考,并可生成最高4K分辨率的图像[20][22] - FLUX.1 Kontext模型于今年5月发布,首次引入文本与图像双输入机制,采用流匹配技术改变传统扩散模型架构[20] - 公司技术根基源于潜在扩散方法,该方法是许多生成式AI技术的基础,最初在消费级硬件的超小型GPU上开发以实现高效算法[14] 公司团队与战略 - 公司创始团队来自Stable Diffusion的核心研发团队,于2024年从Stability AI离职后创立该公司[15] - 公司将总部设在德国弗赖堡,以远离硅谷喧嚣,保持团队极度专注的研发状态,团队规模已从10人扩展至50名全职员工[23][24] - 公司核心战略包括:通过开源部分FLUX模型赢得开发者社区认可且成本低于竞争对手;将新融资重点投入计算基础设施升级与商业团队扩充;立志在从广告到好莱坞的颠覆性市场中竞争[24] - 公司正积极在创意产业建立信任,在好莱坞开拓人脉,并强调严肃对待知识产权,目标是增强创作者能力而非取代现有创作[25]
BFL 创立一年估值 32.5 亿美金,AI 原生版 Dropbox 来了
投资实习所· 2025-12-02 13:12
产品传播与商业转化 - 图片和视频的传播效果良好 但长期持续使用取决于能否转化为生产力工具或帮助企业及用户赚钱的产品[1] - OpenAI的Sora早期获得大量自发传播 但近期用户使用量已大幅下跌 表明即使是知名公司单独推出新产品也存在挑战[2] - Google将Nano Banana能力整合到现有产品中是明智做法 单独推出产品希望不大[2] Elevenlabs财务表现 - 语音AI公司Elevenlabs过去12个月收入达到1.93亿美元 其中50%来自思科和Twilio等企业客户 另外50%来自YouTuber、播客主播和作家等早期用户[2] - 公司已经实现盈利 利润率约为60%[2] Black Forest Labs融资与估值 - AI图片生成创业公司Black Forest Labs完成3亿美元B轮融资 估值达到32.5亿美元[3] - 公司成立于2024年8月 估值增长迅速[3] - 融资由Salesforce Ventures和Anjney Midha联合领投[3] BFL技术愿景与定位 - 公司致力于构建像素级前沿模型 创造相机无法捕捉的画面 开发理解意图而不仅仅是执行提示的系统[3] - 长期目标是统一视觉感知、生成、记忆和推理 为视觉智能奠定基础[3] - 定位为模型企业 不直接推出面向用户的产品 而是通过API与Adobe、Canva、Meta和微软等公司合作[6] BFL团队背景与技术策略 - 三位联合创始人都是Stable Diffusion系列模型的原始共同创作者 也是潜在扩散模型的先驱[4] - 其研究成果为开源图像生成社区奠定基石 并影响了DALL-E 2/3和Sora等闭源模型的架构[4] - 采用开放权重方式发布核心模型FLUX.2 允许研究人员和开发者免费使用、定制和部署[6] - 技术成为Hugging Face上最受欢迎的图像模型之一 成功将研究成果转化为生产力工具[6] AI原生存储产品 - 有团队开发AI原生版Dropbox 种子轮融资近800万美元[6] - 与Google Drive和Dropbox基于文本的AI搜索不同 该产品愿景是成为文件操作系统 从存储优先变为理解优先[7] - 团队从零开始构建完全不同的技术架构[7]
6B文生图模型,上线即登顶抱抱脸
量子位· 2025-12-01 12:26
模型发布与市场表现 - 阿里通义发布全新6B参数图像生成模型Z-Image,首日下载量高达50万次 [1] - 模型上线不到两天即登顶HuggingFace两个榜单第一 [1] - 模型虽小但出图质量不输同期发布的FLUX.2,在画质、文本、推理等方面达到SOTA级别 [3] 模型版本与技术特点 - Z-Image-Turbo版本已开源,参数量约6B,在写实风格图像生成和中英文文本精准渲染方面表现较好 [8] - Z-Image-Edit版本针对图像编辑任务微调,可上传图片并通过自然语言指令进行精确修改 [8] - Z-Image-Base版本为未压缩的完整基础模型,面向开发者和研究者 [8] - 模型采用可扩展的单流DiT架构,将文本token、视觉语义token和图像VAE token统一处理,减少参数冗余和计算浪费 [35] - 通过Decoupled-DMD蒸馏技术,仅需8次函数评估即可生成高清图像,大幅提升速度 [39][40] 图像生成能力评估 - 在真实感和美学处理上表现出色,能生成具有电影级真实感的场景和接近专业影棚级的写实肖像照 [11][14] - 具备较强的文字处理能力,能较好处理一级标题的渲染,但小字号文字仍存在变形问题 [18][19] - 语义理解能力到位,能根据指令生成符合要求的科普漫画内容 [20][22] - 用户生成内容涵盖复古电影质感大片、微观迷你世界场景、显微镜级别昆虫特写等,展示模型多样化应用潜力 [24][27][30] 性能优势 - 模型架构优化和蒸馏技术结合,在不牺牲质量的前提下大幅减少计算量,实现高效运行 [34][43] - 网友反馈模型能流畅运行在个人电脑上且不烧显卡,凸显其易用性和低资源消耗优势 [7]
FLUX.2开源了,但是我好像也看到了小公司的无力。
数字生命卡兹克· 2025-11-26 09:20
公司产品发布 - FLUX公司发布了4款基础模型和1个VAE模型,其中Pro和Flex两款最强大的模型为闭源,另有一款蒸馏模型klein即将开源 [8][9][11] - 开源模型链接已发布在Hugging Face上,用户可通过其官网或liblibai平台使用该模型 [11][12][13] 产品性能对比:图像生成 - 在相同提示词下,FLUX.2生成的图像效果与Nano Banana Pro存在显著差距,例如在“人类考古学家发现旋转金属球”和“日常松弛感亚洲美女”等场景中,后者在真实感和细节上表现更优 [15][16][17][18][20] - 在生成具有特定风格要求的图像时,如“《龙珠Z》神龙”的彩色铅笔风格和“《天书奇谭》”中国山水画风格海报,FLUX.2的表现亦不如对手 [22][24] 产品性能对比:指令理解与编辑 - 在“用嘴改图”功能上,FLUX.2表现不佳,例如在要求“让左边人物cosplay右边角色”的指令下,其生成结果与预期偏差巨大 [28][29][31][32][34] - 在将动漫人物“变成真人照片”的指令中,FLUX.2的生成效果同样不理想 [37][38] 核心竞争差距:世界知识 - 产品性能的根本差距源于底层模型的世界知识差异,Nano Banana Pro背后是Gemini 3 Pro多模态大模型,而FLUX.2使用的是Mistral-3 24B模型 [41][42][44] - 在需要深度领域知识的任务中,如生成“海贼王战力排名信息图”,Nano Banana Pro能准确理解并呈现内容,而FLUX.2则显示出对内容的不理解 [48][49][51][52] - 在处理包含多个跨动漫、文化角色的复杂提示词时,Nano Banana Pro能几乎全对地生成集体大合照,而FLUX.2则生成乱码,显示出其在世界知识上的严重短板 [54][55][57][60][61] 行业趋势分析 - 当前AI绘图领域的竞争已从单纯的图像生成质量转向对世界模型的认知能力,这需要模型具备从海量多模态数据中学习的世界知识 [75][76][77][78][79] - 大厂凭借其在数据、算力和人才密度上的绝对资源优势,正对中小型模型公司形成“降维打击”,行业壁垒日益增高 [64][65][80][81][90] - 尽管FLUX.2等开源模型为中小企业和开发者提供了宝贵的火种和基石,具有重要价值,但其技术理想主义在绝对的资源壁垒面前显得脆弱 [82][83][84][85][86][91]