Workflow
AI生图
icon
搜索文档
太炸裂了!全网实测Nano Banana Pro,网友:这模型里到底装了什么鬼东西!
量子位· 2025-11-21 14:29
一水 发自 凹非寺 量子位 | 公众号 QbitAI 炸裂!太炸裂了! 谷歌Nano Banana Pro 一出世,全网都开始直呼: 这模型里到底装了什么鬼东西! 硅谷VC大佬Deedy首先分享了自己的实测案例,看完只能说真不怪网友大惊小怪(doge)。 扔给它一份英伟达最新财报PDF文件,结果它秒秒钟生成了一张重点突出、内容精致的图表: 又或者直接将未加工的Graphviz图表代码丢给它,结果一次性就生成了带logo的可视化效果图: 更别提各种论文流程图、核心概念解释图了 (连Transformer架构图都能AI直出) : 呼~Nano Banana Pro真有这么强吗?咱们这就实测见真章。 实测Nano Banana Pro 前情提醒,Nano Banana Pro是谷歌趁着Gemini 3 Pro好评如潮而推出的最新、最强文生图模型。 它又名 Gemini 3 Pro Image ,整合了Gemini 3 Pro的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑。 其主要升级之处体现在: 目前, 普通用户可以在Gemini应用中免费体验 ——选择"创建图像"功能时就能使用,不过免费用户有额度 ...
AI技术滥用调查:“擦边”内容成流量密码,平台能拦却不拦?
虎嗅· 2025-10-12 18:08
AI技术滥用现状 - AI技术被滥用于制作不雅视频、克隆照片和恶意造谣,受害者包括高校导师、白领和公众人物等[1][6][8][9] - 社交平台上明星"AI换装"和"AI擦边"内容泛滥,成为流量密码,部分账号专门发布此类内容吸粉变现[2][10][11][13] 平台治理措施 - 小红书2025年上半年共处置治理虚假低质AIGC笔记60万篇,平台正加大AIGC识别模型研发投入并实施主动标识[24] - 抖音表示根据社区自律公约对低俗媚俗内容采取限制措施,无论是否通过AI生成[25] - 平台通常会在AI生成图片上标注"疑似AI创作,请谨慎甄别"等提示语,但律师认为仅标注不能自动豁免法律责任[27][28] AI应用实测结果 - 测试的12款AI应用中,5款(即梦、豆包、可灵、腾讯元宝和阶跃AI)可实现明星"一键换装"[32] - 9款应用(即梦、豆包、堆友、无界AI、秒画、LiblibAI、可灵、星流AI、腾讯元宝)能生成衣着暴露的"擦边"图片[40] - 部分应用如LiblibAI生成的图片尺度较大甚至露点,该平台模型创作者已突破两千万,累计生成图片逾5亿张[43] 企业回应与整改 - 星流AI和LiblibAI母公司承认新模型上线初期识别精度波动导致风险内容遗漏,已完成紧急修复优化[46][47] - 豆包和即梦表示严格遵守法律法规禁止生成色情内容,承认AI技术处于发展早期将持续改进[51] - 无界AI月独立设备数为13.5万台,公司称已采取多项防范措施[51] 技术防范瓶颈 - 专家指出拦截违规内容在技术上无根本难度,但需要消耗算力成本,可通过构建名人识别模型充当防火墙[55][56] - AI公司可对用户提示词进行合规改写,并对生成图片实施实时风险检测,但模型本身的大尺度内容漏过问题仍需解决[50] 法律监管环境 - 我国已出台多项法规包括《生成式人工智能服务管理暂行办法》《人工智能生成合成内容标识办法》等对AI内容进行规范[57][58] - 现行法律对"擦边"内容存在界定标准模糊、审核义务边界不明确等问题,导致灰色地带较多[60] - 2023年三部门联合指导意见强调利用深度合成技术发布违法信息的情形将依法从重处罚[59]
登顶苹果应用榜!谷歌火遍全网的“纳米香蕉”,凭啥击败ChatGPT?
证券时报· 2025-09-16 15:51
谷歌Gemini应用市场表现 - 谷歌旗下AI应用Gemini在美区AppStore下载量超越ChatGPT,登顶免费榜第一名 [1][2] - 除美国外,Gemini在加拿大、印度、摩洛哥等国家同样实现下载榜登顶,打破ChatGPT长期垄断地位 [2] Nano Banana技术突破与用户增长 - 谷歌DeepMind发布新一代AI图像生成与编辑模型Gemini 2.5 Flash Image,代号Nano Banana,在图像质量、编辑控制和应用场景上有大幅改进 [4] - Nano Banana功能上线后累计完成超2亿次图像编辑,并带动超1000万新用户尝试Gemini应用 [4] - 技术层面实现四大提升:自然语言驱动图像编辑、角色一致性与场景融合、多图融合与世界知识注入、降低3D建模门槛 [4][5] - 用户体验范式重构,实现从复杂工具栏到一句自然语言、从渲染缓慢到秒级出图、从效果不稳定到跨图一致性等突破 [9] 资本市场反应与行业影响 - 受益于反垄断裁决结果好于预期及Nano Banana市场表现,谷歌股价持续上涨,市值冲上3万亿美元 [1][9] - 花旗集团分析师将谷歌母公司Alphabet目标价从225美元上调至280美元,理由是Gemini在广告与云业务中采用加速,产品开发周期更快 [9] - Nano Banana火爆点燃图像生成视频赛道战火,国内厂商如字节跳动Seed团队推出豆包图像创作模型Seedream 4.0,生数科技推出Vidu Q1参考生图功能正面对标 [10] - 华泰证券认为原生多模态模型架构获业界认可,多模态为主的产品商业化快于文本产品,多模态大模型和应用发展奇点将至 [10] 多模态AI投资机会 - 多模态在算力和应用两方面带来投资机会:算力侧,原生多模态模型需要更多算力,视频推理算力需求远大于文字 [11] - 应用侧,国内视频生成模型领先,广告、零售、创作、教育等领域均有AI化需求 [11]
“AI生图”做题家大赛,谁赢了?
中国经营报· 2025-09-13 09:46
AI图像生成模型竞争格局 - 谷歌于8月末发布Gemini 2.5 Flash Image模型(代号“纳米香蕉”),推动了AI手办图等应用的流行[2] - 9月初,字节跳动Seedream 4.0和生数科技Vidu Q1模型相继面世,标志着行业竞争在不到半个月内急剧升温[5] - 知名评测机构Artificial Analysis于9月12日发布消息称,字节跳动Seedream 4.0在文生图和图像编辑排行榜上超越谷歌纳米香蕉,位列榜首[8] 主要模型性能对比 - 在AI手办生成测试中,谷歌纳米香蕉生成的小猫手办质感更贴近真实手办,光线明暗处理得当[11] - 字节跳动Seedream 4.0在测试中出现对提示词理解有误的情况,例如将手办盒子生成人形玩偶而非小猫[11] - 生数科技Vidu Q1在测试中基本未对小猫进行手办材质调整,毛发质感与原始照片一致,效果最不理想[11] - 在建筑线稿转效果图测试中,Seedream 4.0首次生成效果惊艳,而纳米香蕉需二次提示才能生成真实效果图片[14] - 在文生图测试中,Seedream 4.0生成的家庭场景人物表情皆大欢喜,而纳米香蕉则添加了更多菜式,场景更贴近真实家常午饭[18] - 在图像融合测试中,Vidu Q1对人物处理较好但未理解电动车构造,Seedream 4.0生成严谨,纳米香蕉则出现理解偏差[21] 行业技术发展现状 - AI图像生成模型在文生图、参考生图、图像编辑等方面的能力实现飞跃式提升[21] - 当前模型相比早期产品,在理解能力、出图速度、画面真实性和清晰度上均有显著突破[21] - 模型最终生成效果与提示词紧密相关,提示词描述简单可能导致AI理解出现误差[21] - AI生图能力考察涵盖一致性、真实性、清晰度、语义理解和美学等多个维度[21]
Qwen新开源,把AI生图里的文字SOTA拉爆了
量子位· 2025-08-05 09:40
通义千问开源图像生成模型Qwen-Image - 通义千问开源200亿参数图像生成基础模型Qwen-Image,采用MMDiT架构,是系列中首个图像生成基础模型[3][4] - 模型主打复杂文本渲染能力,能准确生成包含复杂图文混合布局的图像,文字准确度和契合度高[5][6] - 支持生成海报、PPT、商品宣传图等多种应用场景,文字渲染能力突出[8][16][22] Qwen-Image核心能力 - 具备复杂文本渲染能力,支持多行布局、段落级文本生成和细粒度细节呈现,中英文均能高保真输出[28] - 拥有一致性图像编辑能力,支持风格迁移、增删改、细节增强、文字编辑等多种操作[27] - 采用渐进式训练策略,从非文字到文字渲染逐步过渡,增强原生文字渲染能力[34] 性能表现 - 在多个公开基准测试中实现SOTA,包括通用图像生成的GenEval、DPG和OneIG-Bench等[29][30] - 在文本渲染基准LongText-Bench、ChineseWord和TextCraft上表现尤为出色,中文文本渲染大幅领先现有最先进模型[32][33] 实测效果 - 情境插画生成效果优秀,文字与画面融合度高,细节氛围感强[11][13][14] - 能准确理解提示词生成PPT和海报,主体文字和图中图符合要求[16][18][20] - 商品宣传图生成中能准确对应文字与画面元素[22][24]
“没有AI味”的Flux.1新模型,现可以免费试用
量子位· 2025-08-05 09:40
模型发布与核心特点 - 全新AI生图模型FLUX.1 Krea [dev]发布,主打"没有AI感"的自然细节和真实感,避免过曝高光和过度饱和纹理[1][3][5] - 该模型为Krea 1的开源权重版本,训练目标是生成更真实、更多样化的图像[5] - 官方称其在人类偏好评估中超越以往开源文生图模型,与FLUX1.1 [Pro]等闭源方案表现相当[71] 技术性能测试 光学真实性 - 模型能理解物理光学规律,如为不锈钢管主动添加锈点特质增强真实感[15] - 但对波浪等动态元素理解较浅显,存在重复失真现象[21] 纹理连续与语义理解 - 微观结构连续性表现良好,如针织面料纹理过渡自然[27] - 难以准确理解特定术语如"斜纹针",且对植物类型识别能力有限[28][32] 透视与动态模糊 - 能处理多物体交错场景的空间关系,实现浅景深效果[38] - 对运动物体的时间维度模拟不足,模糊方向不符合物理规律[43][44] 物理规则遵循 - 能优先遵循基本物理规律(如保持树影存在)[47] - 面对明显反常识场景(如空中游动的鱼)会放弃物理规则[49] 功能应用与局限 - 支持风格选择和图像调整功能,但人物特征识别能力较弱[61][64] - 架构与FLUX.1 [dev]生态系统兼容,可作为下游应用定制的基础模型[73] - 免费试用存在额度限制,默认输出4张图可能消耗较多额度[74] 行业活动 - 8月7日将举办AI沙龙,聚集百度文心快码、智谱、Kimi等厂商探讨AI Coding发展[76]
8点1氪|黄杨钿甜父亲被立案调查;活期存款已近0利率;小米YU7正式发布,标准版续航835公里
36氪· 2025-05-23 07:56
三一重工港股上市 - 三一重工向港交所提交上市申请书 中信证券为独家保荐人 [1] 银行利率调整 - 5月21日平安银行等7家股份制银行跟进下调存款利率 活期存款利率降至0.05% 较此前下调5个基点 [2] - 定期整存整取利率同步下调 三个月/半年/一年/二年期分别为0.7%/0.95%/1.15%/1.20% 三年期和五年期分别为1.30%和1.35% [2] - 9家股份行整存整取挂牌利率最高降幅达25个基点 个别银行定存产品降幅达40基点 [3] 小米汽车发布 - 小米YU7正式发布 搭载V6s Plus电机 最大马力690PS 零百加速3.23s 最高时速253km/h [3] - 提供三个版本 标准版续航835公里 雷军表示定价不可能19.9万 预计7月上市 [3][6] - 小米已申请注册多枚"XIAOMI YU7"商标 涉及运输工具等类别 [6] 汽车行业动态 - 奇瑞捷豹路虎否认停产传闻 2025财年全球营收290亿英镑 税前利润25亿英镑 [5] - 特斯拉CEO马斯克表示愿意授权FSD技术给其他车企 正与多家公司洽谈 [15] - 高合汽车成立新公司江苏高合 注册资本1.43亿美元 华人运通持股30.2% [11] 科技行业动态 - 华为鸿蒙折叠电脑预约量超10万 起售价23999元 [7] - 苹果将iPhone 7 Plus和部分iPhone 8列为过时产品 [16] - OpenAI计划推出1亿台AI伴侣设备 目标2026年底前发货 [17] - 京东工业发布行业首个供应链核心工业大模型Joy industrial [17] 上市公司财报 - 滔搏2024/25财年营收270.1亿元 净利润12.8亿元 门店数约5000家 [18] - BOSS直聘Q1营收19.23亿元 同比增长12.9% 付费企业客户640万 [19] - 联想集团2024/25财年营收4985亿元 同比增长21.5% 净利润104亿元 [21] 融资动态 - 泰国IMCOCO集团完成亿元级Pre-A轮融资 资金用于产能扩建 [23] - 影诺医疗完成数千万融资 资金用于产品注册及海外拓展 [24] - Airwallex完成3亿美元F轮融资 投后估值62亿美元 [25] - 中旷产业完成数千万元天使轮融资 资金用于园区开发 [26] - 利德健康完成近亿元天使轮融资 资金用于技术研发 [27] - 筋权堂生物科技完成500万元天使轮融资 资金用于服务优化 [28] 行业趋势 - 5G-A商用网络覆盖全国超300城 数据传输速度较5G提升10倍 [13] - 家电类商品零售额连续8个月保持两位数增长 4月同比增长38.8% [11] - 中央网信办督导抖音、小红书等平台优化算法推荐功能 [11] - 抖音升级侵权举报服务 支持阻断相同侵权内容传播 [12]
8点1氪:黄杨钿甜父亲被立案调查;活期存款已近0利率;小米YU7正式发布,标准版续航835公里
36氪· 2025-05-23 07:53
三一重工港股上市 - 三一重工向港交所提交上市申请书 中信证券为独家保荐人 [4] 银行利率调整 - 多家股份制银行跟进下调存款利率 活期利率降至0.05% 定期利率降幅5-25个基点 [5] - 部分银行个别期限定存产品利率降幅达40基点 [6] 小米YU7发布 - 小米YU7正式发布 标准版续航835公里 0-100km/h加速3.23秒 [6] - 雷军表示定价不可能19.9万 预计30多万 7月正式上市 [7] - 小米已申请多枚YU7相关商标 包括图形商标 [9] 奇瑞捷豹路虎生产情况 - 奇瑞捷豹路虎否认停产传闻 称在华生产一切正常 [9] - 捷豹路虎2025财年全球营收290亿英镑 税前利润25亿英镑 [9] 华为鸿蒙折叠电脑 - 鸿蒙折叠电脑官网预约量超10万 起售价23999元 [10] 宠物食品行业 - 皇家宠物食品启动兽医师心理健康公益行动 [10] 快手运营争议 - 快手否认强制员工每天刷1小时短视频传闻 [11] 李宁公司声明 - 李宁公司发布声明 将对恶意抹黑行为采取法律手段 [11] 中国联通人事变动 - 中国联通董事王俊治因年龄原因辞职 [12] 央行操作 - 央行5月23日将开展5000亿元1年期MLF操作 [13] 教育行业 - 教育部拟同意设置32所新大学 [14] 微信广告争议 - 微信否认朋友圈广告盗用好友身份进行评论 [14] 蜜雪集团市值 - 蜜雪集团市值突破2000亿港元 达2033亿港元 [14] 高合汽车新公司 - 江苏高合汽车有限公司成立 注册资本1.43亿美元 [15] 家电零售数据 - 家电类商品零售额连续8个月保持两位数增长 4月同比增长38.8% [16] 算法推荐治理 - 中央网信办督导抖音、小红书等平台优化调整算法推荐 [16] 抖音侵权处理 - 抖音升级侵权举报服务 支持阻断相同侵权内容传播 [17] 5G-A商用进展 - 5G-A商用网络覆盖全国超300城 数据传输速度较5G提升10倍 [18] - 万得5G概念指数和6G概念指数分别累计上涨17.14%和20.61% [18] 美股市场 - 美股三大指数涨跌不一 纳指涨0.28% 标普500跌0.04% [18] - 热门中概股多数下跌 小鹏汽车跌超7% [18] 加密货币交易所 - Kraken计划允许非美国客户通过数字代币交易苹果、特斯拉等热门股票 [19] 特斯拉技术授权 - 马斯克表示愿意将FSD技术授权给其他车企 正与几家公司洽谈 [19] 三星生物制剂业务调整 - 三星生物制剂拟分拆公司 剥离生物仿制药业务 [20] 雀巢战略调整 - 雀巢CEO表示将重新聚焦核心业务 [21] OpenAI设备计划 - OpenAI计划推出1亿台AI"伴侣"设备 目标2026年底前发货 [22] 京东工业大模型 - 京东工业发布行业首个以供应链为核心的工业大模型Joy industrial [22] 公司财报 - 滔搏2024/25财年营收270.1亿元 净利润12.8亿元 门店数约5000家 [23] - BOSS直聘Q1营收19.23亿元 同比增长12.9% 净利润5.12亿元 [24] - 联想集团2024/25财年营收4985亿元 同比增长21.5% 净利润104亿元 [25] 小米新品发布 - 小米15S Pro发布 售价5499元起 搭载3nm旗舰处理器 [26] - 小米平板7 Ultra发布 售价5699元起 同样搭载3nm旗舰处理器 [26] 融资动态 - IMCOCO集团完成亿元级Pre-A轮融资 将用于泰国工厂扩建等 [27] - 影诺医疗新一轮数千万融资领投方已过投决 将用于产品报证等 [28] - Airwallex完成3亿美元F轮融资 投后估值62亿美元 [29] - 中旷产业完成数千万元天使轮融资 将用于产业园区开发等 [30] - 利德健康完成近亿元天使轮融资 将用于技术研发等 [32] - 杭州筋权堂生物科技完成500万元天使轮融资 将用于服务优化等 [33] AI生图领域 - OpenAI、谷歌在AI生图领域连放大招 AI生图玩法全面升级 [35] - 活动将拆解最新工具、示范实战技巧 帮助职场人开辟第二收入曲线 [35]
用 AI 做图赚到「第一桶金」之后,我却选择了「金盆洗手」……
36氪· 2025-05-20 16:10
AI生图技术在童书插画行业的应用 - AI生图技术目前无法让普通人完全替代插画师,但能让掌握Photoshop的美工人员实现插画师的部分功能[3] - 在童书插画领域,AI生图可以实现每月上万张的大批量生产,显著提升效率[4] - 自动化流程包括提示词生成、批量出图、图片筛选、高清放大等环节,可将人工操作降至最低[5][55] 技术选型与成本控制 - Flux dev模型在多人场景和服装颜色准确性上优于SDXL,成为最终选择[8][9][13] - 云端计算平台Runcomfy按分钟计费,相比按张计费的Replicate更具成本优势[17][21][23] - 整套系统单张图片生成成本控制在0.2元人民币左右,显著低于人工绘制成本[18][90] 质量控制与风格适配 - 需要针对特定风格训练Lora模型,训练成本约100元人民币,可高度还原客户要求的风格特征[29][37] - AI在人物互动关系和手部细节表现上存在明显缺陷,需要通过批量生成和人工筛选来解决[30][35] - 最终成品需经过6轮审稿,单项目修改量达191张,显示AI生图在细节控制上仍有局限[117] 商业模式与行业影响 - 该案例展示了AI生图在出版行业的商业化路径,通过技术整合实现部分插画工作的工业化生产[4][56] - 但修改量大、时间紧张的特点使得单人运营模式难以持续,需要更成熟的团队协作方案[198] - AI生图与传统PS技巧结合可解决90%的修改需求,但核心创意部分仍需人工干预[119][127]
9点1氪|官方回应正新鸡排鸡腿大量生蛆;取款身亡老人家属称与农行达成和解;胖东来本月销售额接近10个亿
36氪· 2025-05-17 08:49
上市动态 - 百力司康考虑赴香港IPO [1] - 华电新能源集团获证监会批准在上交所主板上市 [2] 公司事件 - 正新鸡排门店因鸡腿生蛆事件被调查 涉事门店证照齐全 同类产品已封存送检 [3] - 胖东来官网恢复运营 本月销售额达9.6亿元 2025年累计销售额89.8亿元 [3] - 今麦郎为娃哈哈代工生产12亿瓶纯净水 每瓶净利润仅2分钱 [6] - 中国电信聘任刘桂清为总裁兼首席运营官 [6] - 沃尔玛因美国关税政策上调部分商品售价 [8] - 美国之音或解雇超500名合同工 [9] 行业动态 - 广州咖啡节现1530元天价咖啡 引发网友热议 [4] - 中国中车研发时速600公里高速磁浮列车 广州至北京有望缩短至4小时 [6] - 商务部推进离境退税政策 扩大入境消费 [7] 科技与AI - INAIR发布全球首台量产AI空间计算机 计划6月发售 [9] - 腾讯混元发布图像生成2.0模型 支持实时生图 [10] - Manus推出图像生成功能 结合其他工具完成任务 [11] - 百度AI搜索上线DeepSearch 支持百亿级内容库搜索 [11] 投融资 - 北京真源诚传科技完成3000万元A轮融资 加速"知悟"生态建设 [12] 财报数据 - 富士电视台母公司2024财年净亏201亿日元 为上市以来首次亏损 [13] - 韩国三养食品一季度营业利润增长67% 达1340亿韩元 火鸡面海外需求激增 [13][14] 工资数据 - 2024年全国城镇非私营单位就业人员年平均工资124110元 私营单位69476元 [5] 高管动态 - 黄仁勋专机抵达台北 计划与供应链伙伴聚餐 [5] - 雷军回应小米SU7车祸事故 强调汽车安全领域需行业领先 [4][5]