产品发布核心观点 - 谷歌正式发布其专业级图像生成模型Nano Banana Pro(Gemini 3 Pro Image),该模型结合了Gemini 3 Pro的强大推理能力和世界知识,在图像生成的控制力、文字渲染和知识整合方面实现显著飞跃 [3][4][6] 技术能力升级 - 模型支持生成2K和4K高分辨率图像,图像像素量显著提升,同时在细节刻画、画面精度、生成稳定性及可控性上全面升级 [8] - 支持广泛的图像长宽比,解决了基础款模型难以控制图像比例的问题,作品可直接用于从社交媒体到印刷物料等多种平台 [9][11] - 视觉一致性控制能力增强,最多可使用14张参考图像,并保持多达5个人物的一致性与相似度 [13][23] - 具备强大的文本生成能力,能够生成包含准确、清晰可读、多语言文本的视觉内容,是生成图像内可读文本的最佳模型 [34][40] - 凭借与Gemini 3大模型的深度融合,模型能将庞大知识库融入生成过程,产出更具事实准确性的视觉内容,并可结合Google搜索检索基座连接到实时网页内容 [43][44][45] - 新增根据内容自动生成PPT页面的能力,实现从文字到展示的流程自动化与智能化 [49][50] 创意与控制功能 - 用户可对画面进行近乎分子级的操控,包括自由选取并重塑图像任意局部区域、切换摄像机角度、调整焦点位置、应用电影工业级调色以及重塑场景光照 [25][32] - 这些能力使模型从简单的图像生成工具跃升为支持创作者进行分镜级、视觉导演级创作的图像引擎,并可结合Veo 3模型生成电影风格视频 [26][29] 内容验证与透明度 - Gemini应用中加入新功能,用户可直接验证某张图像是否由Google AI生成或编辑,这一能力由SynthID数字水印技术实现 [54][56] - 自2023年推出以来,已有超过200亿份AI生成内容通过SynthID加上水印,通过Gemini API、Vertex AI等生成的Nano Banana Pro图像将嵌入C2PA元数据以提升透明度 [57] 产品部署与可用性 - 模型在多个Google产品中上线,面向消费者与学生的Gemini App在选择“Create images”并使用“Thinking”模型时将在全球陆续上线,免费用户获得有限免费额度,订阅用户获得更高额度 [59][61] - 面向专业人士,Google Ads将升级图像生成功能至Nano Banana Pro,广告主可在Asset Studio中使用最前沿的生成与编辑能力 [60] - 面向开发者与企业,模型可通过Gemini API、Google AI Studio和Vertex AI以付费预览形式使用,企业可立即在Vertex AI中开始大规模内容创作支持 [65][66] - 建议使用Nano Banana(Gemini 2.5 Flash Image)获取更快、更低成本的图像生成/编辑,使用Nano Banana Pro处理更复杂、要求更高的任务,但成本与延迟也更高 [70]
谷歌Nano Banana Pro上线,深度结合Gemini 3,这下生成世界了