Gemini 3.1 Flash Image
搜索文档
谷歌NanoBanana2亮相,多模态步入产业重构深水区
中邮证券· 2026-03-18 12:23
行业投资评级 - 行业投资评级为“强于大市”,且评级为“维持” [1] - 行业收盘点位为825.13,52周最高为1021.75,52周最低为591.71 [1] 核心观点 - 报告核心围绕多模态AI技术的重大进展及其对内容产业的变革性影响展开 [4][5][6] - 谷歌发布Nano Banana 2,其性能登顶文生图全球榜首,在Artificial Analysis的文生图基准测试中位居全球第一,在Image Arena中其文生图斩获1279 Elo得分位居第一 [4] - Nano Banana 2通过成本腰斩与质量跃升,有望加速视觉创作的工业化落地与商业变现 [5] - 同期国内多模态赛道密集发力,阿里发布千问Qwen-Image-2.0,字节Seedance 2.0全量上线,印证2026年或成多模态商业化加速年 [6] - 多模态竞赛已步入产业重构的深水区,模型能否低成本、高质量赋能产业应用已成为未来核心竞争力 [6] 事件与模型分析 - **谷歌Nano Banana 2模型特点**:该模型将Gemini Flash的高速智能融入视觉生成,利用世界知识库实现精准文本呈现与翻译,保持最多5个角色和14个对象的一致性,支持从512p到4K的多种分辨率 [5] - **成本优势**:Nano Banana 2基于Gemini 3.1 Flash架构优化,定价降至每百万token 60美元,相较Nano Banana Pro输出定价(每百万token 120美元)价格腰斩 [5] - **产业影响**:模型迭代显著优化了AI生图的成本与效率曲线,能推动文生图转向生产力工具,助推AI图像生成进入工业化落地阶段,可广泛赋能广告、影视、游戏等B/C端内容生产及创意产业 [5] - **国内进展案例**:使用Seedance工具制作的2分钟科幻短片《归途》整体成本仅330.6元,而传统制作框架下成本可能高达数十万;首批接入Seedance 2.0的时刻互动,月产AI短剧超320分钟 [6] 投资建议 - **广告营销领域**:多模态AI有望推动营销物料边际成本指数级下降,建议关注易点天下、蓝色光标、浙文互联、分众传媒、引力传媒等 [7] - **IP储备与内容转化领域**:AI极大降低了文字IP向视频内容转化的门槛,海量优质IP储备的公司价值有望重估,建议关注光线传媒、中国电影、北京文化、华策影视、上海电影、中文在线、阅文集团等 [7] - **游戏产业领域**:多模态产业化加快有望推动游戏产业从美术降本增效向AI原生游戏变革,建议关注腾讯控股、网易、恺英网络、吉比特、完美世界、巨人网络、世纪华通、贪玩等 [7][8]
Nano Banana 2发布!速度更快,4K直出,接入谷歌全线产品
Founder Park· 2026-02-27 12:07
产品发布与核心性能 - 谷歌发布了最新图像生成模型Nano Banana 2,该模型基于Gemini 3.1 Flash Image,在生成速度、多语言文字处理和实时联网能力上均有大幅提升,并能直接生成4K图像 [2] - 在Artificial Analysis的文生图基准测试中,Nano Banana 2位列全球第一,在图像编辑能力上排名第三,仅次于GPT Image 1.5和Nano Banana Pro [4][5] - 在Image Arena的文生图排名中,Nano Banana 2以1279 Elo得分问鼎榜首,其图像编辑实力仅次于GPT Image [6] - 谷歌官方测评显示,Nano Banana 2在开启特定功能后,在整体偏好、视觉质量和信息图表准确性三个维度上全面超越了GPT-Image 1.5、Grok Imagine Image Pro等竞品以及其前代产品Nano Banana Pro [7] - 模型的API定价为每千张图像67.0美元,输出价格约为0.0672美元/张,仅为Nano Banana Pro价格(134.0美元/千张)的一半 [6][9] 核心技术优势:世界知识与文本渲染 - Nano Banana 2的核心优势之一是具备“世界知识”,它全面接入了Gemini的知识库和实时网络搜索,能够基于真实信息进行图像生成 [11] - 该模型能根据真实存在的物体(如建筑)进行网络搜索获取视觉参考,再按照指定风格渲染,确保准确性,例如准确生成克洛·吕斯城堡的立体主义风格图像 [12][22][23] - 基于世界知识,模型能够直接生成信息图表、将笔记转化为示意图以及进行数据可视化,例如生成水循环科普信息图和云类型对比三联画 [13][14][16][18][19] - 谷歌通过“Window Seat”应用展示了此能力,模型可结合知识库、网络图像搜索及实时天气数据,生成基于真实地理和气象信息的飞机窗外风景 [25][26][27] - 模型的第二大优势是强大的文本渲染和翻译能力,解决了AI图像生成中文字渲染不清晰的问题,生成的文字准确清晰,适用于营销海报、贺卡等场景 [28][29] - 模型具备“一键本地化”能力,可将整个广告概念(包括文字和视觉元素)转换成目标市场(如印度)的语言和风格,谷歌为此推出了“Global Ad Localizer”演示工具 [30][31][32] 图像质量与生成能力提升 - 模型在主体一致性上实现大幅提升,在一个工作流中最多能保持5个角色的特征一致,以及14个对象的高保真度 [34][35] - 例如,能生成包含14个风格各异但特征保持一致的角色的农场场景,以及保证3个角色在6张连续叙事图中服装和外貌始终一致 [36][37][38][42][44] - 通过“Pet Passport”应用,用户上传宠物照片后,模型能在保持宠物外观高度一致的前提下,将其置于全球不同著名地标中 [45][46][47] - 模型的指令遵循能力更加精准,能更好地捕捉用户提示中的微妙细节 [48] - 支持从512px到4K的多种分辨率,新增512px层级以优化低延迟和高负载场景;新增4:1、1:4、8:1和1:8等极端宽高比,原生适配各种广告和内容格式 [49] - 为开发者提供可配置的“思考级别”功能,调整模型生成前的推理深度,在高级或动态模式下可显著提升输出质量和指令遵循度 [51][52][53] - 视觉质量全面提升,包括更生动的光影、更丰富的纹理和更锐利的细节 [54][55] 应用生态与市场整合 - Nano Banana 2已全面接入谷歌全线产品,包括Gemini App、Google搜索(含AI Mode和智能镜头)、AI Studio、Gemini API、Vertex AI、Google Antigravity等 [101][102][107][109] - 在Gemini App中,Nano Banana 2将在Fast、Thinking和Pro模型中全面取代Nano Banana Pro,用户仍可手动切换回旧版模型 [104] - 在Flow平台中,Nano Banana 2成为默认模型,所有用户可免积分使用 [110] - 该模型也已集成到Google Ads中,在创建广告系列时会自动提供智能建议 [113]
Nano Banana 2,泄露
36氪· 2026-02-26 07:26
谷歌AI图像生成模型Nano Banana 2传闻 - 过去48小时,谷歌最新图片生成模型Nano Banana 2(又名Gemini 3.1 Flash Image预览版)成为AI开发者圈热议话题,关于其发布的帖子在社交平台X上层出不穷,4K图片四处流传[1] - 如果Nano Banana 2发布,其相对于Nano Banana Pro在性能和价格上会有多大程度的升级引起产业高度关注[3] 传闻中的产品特征 - 根据X平台多方自媒体互证,Nano Banana 2具备4K图像生成能力、更快速度、价格比Nano Banana Pro更低等特征[3] - 如果泄露信息属实,Nano Banana 2或许会结合前两代产品的优势:Flash系列的速度和价格优势,以及接近或优于 Nano Banana Pro的视觉质量[15] - 其生成图像或许会具备原生4K分辨率、更出色的多角色场景处理能力,以及在人体结构、反射、光照等方面更一致的细节表现,据测试人员称,所有这些都实现了闪电般的生成速度,远超以速度慢著称的Pro版[15] - 如果泄露的信息属实,Nano Banana 2或许会是一款超高速、支持4K图像生成、价格比Nano Banana Pro版更低,画质却与之不相上下的模型[16] 发布动态与证据线索 - TestingCatalog News称,谷歌正在为即将发布的Gemini 3.1 Flash镜像预览版做准备,基于Gemini 3 Flash的Nano Banana 2(Flash)模型已于去年12月进行了测试,但随后推迟发布了,或许很快将发布[4] - 一位名为Legit的开发者发布推文称,一个新的匿名模型anon-bob-2已经上线,它很可能是竞技场Arena.ai上的新款Nano Banana Flash模型,由Gemini 3.1 Flash Image驱动[8] - 有用户在谷歌云的企业级AI平台Vertex AI网站上,发现输入Gemini-3后下拉页面出现了Gemini 3.1 Flash Image模型的名字[11] - 另一位X平台用户称,Nano Banana 2(Gemini 3.1 Flash Image预览版)已以匿名用户anon-bob-2的身份活跃于竞技场Arena.ai的图像对战模式[13] - 据Stable Diffusion博客推测,原定于2025年12月进行的(Nano Banana 2)内部测试因质量校准问题而被推迟,现在模型已准备就绪,图像功能可能就在未来几天或几周内发布[15] - 截至发稿,谷歌尚未就此发布任何官方公告[15] 行业竞争格局 - 近一段时间,字节Seedream 5.0、阿里Qwen-Image-2.0、智谱GLM-Image等国产模型相继发布,在指令遵循、图像质量、文字渲染等发面发力,或许都能够与谷歌新图像模型掰腕子,AI图像生成竞赛将再度升级[17]