Nano Banana 2发布！速度更快，4K直出，接入谷歌全线产品

产品发布与核心性能 - 谷歌发布了最新图像生成模型Nano Banana 2，该模型基于Gemini 3.1 Flash Image，在生成速度、多语言文字处理和实时联网能力上均有大幅提升，并能直接生成4K图像 [2] - 在Artificial Analysis的文生图基准测试中，Nano Banana 2位列全球第一，在图像编辑能力上排名第三，仅次于GPT Image 1.5和Nano Banana Pro [4][5] - 在Image Arena的文生图排名中，Nano Banana 2以1279 Elo得分问鼎榜首，其图像编辑实力仅次于GPT Image [6] - 谷歌官方测评显示，Nano Banana 2在开启特定功能后，在整体偏好、视觉质量和信息图表准确性三个维度上全面超越了GPT-Image 1.5、Grok Imagine Image Pro等竞品以及其前代产品Nano Banana Pro [7] - 模型的API定价为每千张图像67.0美元，输出价格约为0.0672美元/张，仅为Nano Banana Pro价格（134.0美元/千张）的一半 [6][9] 核心技术优势：世界知识与文本渲染 - Nano Banana 2的核心优势之一是具备“世界知识”，它全面接入了Gemini的知识库和实时网络搜索，能够基于真实信息进行图像生成 [11] - 该模型能根据真实存在的物体（如建筑）进行网络搜索获取视觉参考，再按照指定风格渲染，确保准确性，例如准确生成克洛·吕斯城堡的立体主义风格图像 [12][22][23] - 基于世界知识，模型能够直接生成信息图表、将笔记转化为示意图以及进行数据可视化，例如生成水循环科普信息图和云类型对比三联画 [13][14][16][18][19] - 谷歌通过“Window Seat”应用展示了此能力，模型可结合知识库、网络图像搜索及实时天气数据，生成基于真实地理和气象信息的飞机窗外风景 [25][26][27] - 模型的第二大优势是强大的文本渲染和翻译能力，解决了AI图像生成中文字渲染不清晰的问题，生成的文字准确清晰，适用于营销海报、贺卡等场景 [28][29] - 模型具备“一键本地化”能力，可将整个广告概念（包括文字和视觉元素）转换成目标市场（如印度）的语言和风格，谷歌为此推出了“Global Ad Localizer”演示工具 [30][31][32] 图像质量与生成能力提升 - 模型在主体一致性上实现大幅提升，在一个工作流中最多能保持5个角色的特征一致，以及14个对象的高保真度 [34][35] - 例如，能生成包含14个风格各异但特征保持一致的角色的农场场景，以及保证3个角色在6张连续叙事图中服装和外貌始终一致 [36][37][38][42][44] - 通过“Pet Passport”应用，用户上传宠物照片后，模型能在保持宠物外观高度一致的前提下，将其置于全球不同著名地标中 [45][46][47] - 模型的指令遵循能力更加精准，能更好地捕捉用户提示中的微妙细节 [48] - 支持从512px到4K的多种分辨率，新增512px层级以优化低延迟和高负载场景；新增4:1、1:4、8:1和1:8等极端宽高比，原生适配各种广告和内容格式 [49] - 为开发者提供可配置的“思考级别”功能，调整模型生成前的推理深度，在高级或动态模式下可显著提升输出质量和指令遵循度 [51][52][53] - 视觉质量全面提升，包括更生动的光影、更丰富的纹理和更锐利的细节 [54][55] 应用生态与市场整合 - Nano Banana 2已全面接入谷歌全线产品，包括Gemini App、Google搜索（含AI Mode和智能镜头）、AI Studio、Gemini API、Vertex AI、Google Antigravity等 [101][102][107][109] - 在Gemini App中，Nano Banana 2将在Fast、Thinking和Pro模型中全面取代Nano Banana Pro，用户仍可手动切换回旧版模型 [104] - 在Flow平台中，Nano Banana 2成为默认模型，所有用户可免积分使用 [110] - 该模型也已集成到Google Ads中，在创建广告系列时会自动提供智能建议 [113]