产品发布与定位 - 基于Gemini 3 Pro构建的多模态AI模型Nano Banana Pro(官方称Gemini 3 Pro Image)正式上线[1] - 产品定位从“创意玩具”升级为“专业”和“工作室级别”工具[2] 核心功能升级 - 具备更强的多模态能力和推理能力,文本渲染准确性更高[2] - 集成Google搜索能力,可先检索用户提示词以增强生成内容的相关性和真实性[2] - 支持2K/4K高保真图像输出,达到专业摄影室水平[2][6] - 支持自定义图片比例生成,包括16:9、21:9、1:1和9:20.9等多种比例[10] - 一致性能力升级,最多可使用14张参考图像保持多达5个人物的一致性[12] - 文字渲染准确性大幅提升,中英文混排时中文也能保证正确[29][31] 技术能力展示 - 支持多轮对话和局部调整,可轻易改变镜头角度、打光效果和画面调色[19] - 具备逻辑推理能力,能理解组件关系而非简单拼合[25] - 基于Gemini 3 Pro的多模态推理能力,能理解抽象表达并运用“世界知识”[29][31] - 在工作流中整合了Veo 3和Google Slides,可将生成图片作为关键帧生成视频并快速搞定PPT排版[19] 应用场景案例 - 生成《VOGUE》杂志封面级超写实肖像画,皮肤质感和发丝细节达到专业水平[4][6] - 生成啤酒海报宣传图并支持多比例延展,电商设计效率提升[8][10] - 生成多人自拍合影,保持人物一致性和自然的光线色彩[15][17] - 生成宫保鸡丁制作流程步骤图和植物光合作用流程步骤图等教育类插画[20][23] - 准确生成Windows 11操作系统桌面截图和游戏模拟器截图,理解界面组件关系[22][25][27] - 生成中国风插画并正确渲染古诗文字,告别“鬼画符”现象[29] - 生成咖啡店实景照片,包含倒影等细节,达到商业用途水平[31][33] - 成功为1979年老照片上色,处理大集体合照难题[34][37]
连夜测试 Nano Banana Pro,从创意玩具变成了专业工具