核心观点 - 谷歌最新推出的文生图模型Nano Banana Pro(又名Gemini 3 Pro Image)凭借其强大的多模态理解、专业图表生成和图像融合能力,在社交媒体上引发了广泛的测试和讨论热潮,被普遍认为将AI生成图像的可用性提升到了新高度 [8][9][22][40] 产品定位与发布背景 - Nano Banana Pro是谷歌在Gemini 3 Pro获得好评后推出的最新、最强文生图模型 [9] - 该模型整合了Gemini 3 Pro的多模态理解能力以及谷歌搜索的知识库,旨在理解现实语义与物理逻辑 [9] - 普通用户可在Gemini应用中通过“创建图像”功能免费体验,但有额度限制,超出后回退至原始Nano Banana模型;Google AI Plus、Pro和Ultra订阅用户享有更高配额 [9] 核心功能与技术升级 - 支持生成复杂专业图表,例如能直接解析英伟达财报PDF并秒速生成重点突出、内容精致的图表 [1] - 能够处理未加工的Graphviz图表代码,一次性生成带logo的可视化效果图 [3] - 文字渲染能力大幅提升,支持多语言直接渲染或翻译(如将图片中的英文翻译成中文、韩文) [10] - 支持最多14张图像融合生成 [10] - 支持更高画质和分辨率,包括2K、4K高清分辨率及多种宽高比(如方形1:1、超宽画幅2.76:1) [10] 实测性能表现 - 在生成技术图表方面表现出色,例如能根据详细提示词生成一辆自行车车架及组件的爆炸视图,并完成毫米级的尺寸标注,被第三方评估认为完成度很高 [11][13] - 在图像融合任务中,能生成符合场景氛围的图片(如玩偶坐在沙发上看电视),但在严格遵循数量等细节指令上可能存在挑战 [15][17][19] - 对物理世界理解增强,生成的透明物体能经受住光影考验 [38] - 谷歌CEO皮猜亲自为其站台,称其拥有最先进的图像生成和编辑功能,具备更高级的世界知识、文本渲染、精度和控制能力,非常擅长制作复杂的图表 [40] 用户创意应用与市场反响 - 在社交媒体上掀起生图热潮,用户利用其生成杂志排版、将草图转化为撕漫感插画、根据参考图生成带故事情节的条漫、制作世界杯对决海报、生成结构分解图以及制作精美手册指南等 [22][23][25][27][30][32][35] - 用户普遍认为其整体实力强悍,几乎凭一己之力使得AI生成的图片离完全真正可用更近一步 [22]
太炸裂了,全网实测Nano Banana Pro,网友:这模型里到底装了什么鬼东西