Workflow
Nano Banana 2(Gemini 3.1 Flash Image)
icon
搜索文档
一手实测Nano Banana 2,我总结了8大新玩法
新浪财经· 2026-02-27 23:22
产品发布与核心参数 - 谷歌正式发布名为Gemini 3.1 Flash Image的“香蕉2”模型,该模型结合了Nano Banana的能力与Flash的速度 [2] - 模型整体性能与Pro版本差距不大,部分场景略有退步 [4] - 核心优势在于价格直接减半,生成一张1K图片的成本从Pro版本的0.134美元降至0.0672美元 [4] - 生成速度大幅提升,API调用可做到2秒出图,每分钟能够稳定输出347至356张图片 [4] - 模型新增4:1、1:4、8:1、1:8等超宽及超窄图片比例,并新增512px低分辨率选项,与原有的1K、2K、4K共同为开发者提供更多选择 [4] - 新增内置web图片搜索功能,可实时从网上搜索参考图用于生成图片 [4] - 一致性能力得到增强,单任务可保持5个角色和14个物体的一致性 [4] 功能特性与玩法扩展 - 模型在“玩法层面”有显著扩展,例如可一键修改素材画幅,将低分辨率原图(如680x680)转换为2K并调整比例(如16:9),同时保持原图结构、UI元素和文字不变 [7][9][11] - 新增的极宽幅比例(如8:1)适用于Banner图、电商详情页、户外广告等设计场景,能提供极致沉浸感 [17] - 内置web图片搜索功能可降低模型幻觉并拓展使用场景,例如可基于实时搜索的天气数据生成准确的信息图,或生成特定动植物的图鉴 [26][28][30] - 模型支持批量出图,在特定平台上可一次性生成20张保持主体一致、风格统一的分镜图,或生成同一主体在8个不同场景下的系列图片 [32][34][36][54][55] - 理论上,配合特定平台的Agent功能,可一次性生成超过100张图片并保持一致性,且生成的图片可直接用于视频创作 [57][58] - 模型对提示词要求宽松,一句模糊的描述即可生成结果 [62] 平台合作与生态 - 平台lovart.ai在第一时间接入了“香蕉2”模型,其付费会员可继续以0积分体验 [2] - 该平台提供了独特的画布功能和新增的编辑功能(如文字编辑),与模型结合可实现更多实用玩法 [11][13][61] - 相较于模型原生的一次一张图的生成方式,在该平台上可进行批量生成,体验不同 [59] - 结合该平台的视频模型,由图片生成的内容可直接用于创作漫剧、短剧,形成内容生产线级别的能力 [58]
谷歌生图新王Nano Banana 2深夜突袭,性能屠榜速度飞升,价格腰斩
36氪· 2026-02-27 08:15
产品发布与核心性能 - 谷歌正式发布其最强图片生成和编辑模型Nano Banana 2 (Gemini 3.1 Flash Image),该模型已在谷歌Gemini应用、搜索、AI Studio等全线产品中上线 [1] - 该模型兼具Pro级功能与Flash级速度,在世界知识、图像质量、推理能力和主体一致性等方面实现全面升级 [2] - 在基准测试中,Nano Banana 2大幅超越了GPT-Image 1.5、Seedream 5.0 Lite、Grok Imagine Image Pro等业界领先模型,配合思考模式、文本和图像搜索工具则全面超越Nano Banana Pro [2] 实测性能与关键升级 - 实测显示,Nano Banana 2可在1分钟内生成4K图片,生成图片细节逼真度增强,指令精准执行上表现超出预期 [4][31] - 模型在文字渲染能力和中国传统文化储备方面有提升,例如能较准确地生成“一只大熊猫写毛笔字”的图片,文字笔锋流畅且基本无错别字 [12] - 模型在处理复杂场景方面有明显提升,例如能生成包含多人、反射、多变光照的复杂城市场景,细节密度远超预期 [23] - 模型解决了部分“时钟难题”,能够根据“传统时钟 21:35”的提示词较精准地生成时钟,但面对更复杂的“时钟+满杯红酒”多重难题时,生成仍不准确 [24][28] - 模型在特殊角度透视还原上比较逼真,能准确控制仰视视角下的人物比例和透视关系,形态没有畸变 [14] - 在多人物互动与情感交流的生图体验中,能准确还原场景、动作和表情,但在眼泪折射等极细微流体形状上仍不自然 [17] - 模型具备精准的指令遵循能力,例如能根据多张输入图片,在保持原图一致性的基础上替换指定物体,并符合物理规律 [19] 核心技术升级点 - 先进世界知识:模型调用Gemini的真实世界知识库,并结合网络搜索获取实时信息和图像,能更准确地呈现特定主题,用于创建信息图表、数据可视化等 [32] - 精准文本渲染与翻译:可为营销素材或贺卡生成准确易读的文本,并能翻译和本地化图像中的文字 [32] - 更强创作控制力:在单个工作流中,最多可保持五个角色的形象相似性,以及最多14个对象的特征一致性 [35] - 生产就绪规格:支持从512px到4K的多种分辨率和宽高比,新增了4:1、1:4、8:1和1:8等原生宽高比支持 [35][39] - 画质提升:呈现更鲜艳的光照、更丰富的纹理和更清晰的细节,在保持速度的同时实现高质量画面效果 [35] - 可配置的思考模式:用户可调整思维水平,使模型在渲染前能推理复杂提示,从而提高输出质量和提示遵循度 [39] 定价策略与产品定位 - Nano Banana 2的价格相比Nano Banana Pro不增反降,在谷歌AI Studio平台,输入图片的单价从2美元降至0.5美元,输出图片的单价也从0.134美元减半至0.067美元 [8] - 按照谷歌设计,Nano Banana Pro适合对事实准确性要求最高的专业任务,而Nano Banana 2则适合快速生成、精确指令遵循和图像搜索集成的工作场景 [10][40] - 在谷歌Gemini应用,Nano Banana 2已取代Fast、Thinking和Pro版本中的Nano Banana Pro,但Pro和Ultra订阅用户仍可按需继续选择使用Nano Banana Pro [10][40] 应用场景与生态整合 - 谷歌构建了名为“靠窗座位(Window Seat)”的示例App,利用Nano Banana 2的知识和网络图像搜索来创建受世界各地位置和实时天气数据启发的逼真窗景 [37] - 谷歌开发了“全球广告本地化器(Global Ad Localizer)”演示App,可将广告翻译成不同语言并适配图像中的文字,以适应国际市场 [38] - “宠物护照(Pet Passport)”演示版只需用户宠物的一张照片,即可确保其在生成的不同目的地图片中保持相同的形象 [39][43] - Nano Banana 2已在谷歌全线产品上线,包括Gemini应用、搜索(新增141个国家和地区及8种语言支持)、AI Studio+API、Google Cloud的Vertex AI以及Flow(对所有Flow用户免费) [40] 行业竞争格局 - 全球AI生图赛道竞赛升级,国内字节Seedream 5.0、阿里Qwen-Image-2.0等国产模型密集出击 [42] - 谷歌正将竞争从单纯的画质比拼,引向世界知识集成、精准指令执行和生产效率的综合较量 [42] - 随着Nano Banana 2发布,谷歌图像生成产品矩阵实现更清晰切割,Pro版驻扎专业高地,Flash版以更快、更便宜、足够好的策略抢占规模化应用场景 [42] - AI图像生成的竞赛已从“能不能画”迈入“画得多快、多准、多便宜”的新阶段 [42]