Workflow
谷歌又来炸场!大热生图模型升级,Nano Banana Pro提供“摄影棚级别”精度和控制
美股IPO·2025-11-21 09:05

产品发布与核心功能 - 谷歌发布基于Gemini的升级图像生成与编辑模型Nano Banana Pro,旨在将AI图像工具从消费级应用推向专业设计领域[4] - 新模型支持生成最高4K分辨率的图像,并在多语言环境下实现精确的文本渲染[1][4] - 模型提供专业级控制能力,用户可像使用专业相机一样调整拍摄角度、景深、色彩和光照等参数,甚至可将场景从白天转换为夜晚[1][4][14][15] - 在素材一致性方面,模型可保持最多五个角色和十四个物体的一致性[1][4] 技术突破与应用场景 - 新模型攻克了AI图像生成中长期存在的文本渲染准确性难题,能更好地规划文本位置、字体特征及其空间关系[9] - 该技术可将菜谱文本转换为图解流程图,可视化天气、体育等实时信息,或将草图转化为物体、手绘笔记转为图表[9][18] - 模型能创建针对国际市场的产品展示、海报和信息图表,支持用户描述所需字体类型或模拟不同手写风格[11] 商业化策略与市场定位 - 谷歌全球免费Gemini用户可在配额限制内使用Nano Banana Pro,付费AI计划订阅用户则拥有更高使用额度[6][20] - 新模型已集成至Canva、Figma、Adobe Firefly和Photoshop等主流设计工具,并通过Gemini API等向开发者开放[6][20] - 生成4K图像的成本为0.24美元,高于原模型生成1024像素图像的0.039美元[18] - 此次发布是谷歌在生成式AI竞赛中追赶OpenAI的重要一步,标志着其将AI技术商业化的最新尝试[6][22] 用户增长与市场反响 - Nano Banana Pro的前身Nano Banana在今年8月面世后帮助Gemini应用在四天内新增1300万用户[22] - Gemini App目前每月活跃用户超过6.5亿,由Gemini驱动的AI Overviews每月用户达20亿[22] - 相比之下,OpenAI的ChatGPT每周活跃用户达8亿,目前在苹果App Store免费应用榜单中排名第一,Gemini位居第二[22] - 谷歌AI产品需求持续增长,许多用户注册Gemini订阅计划以获得高级模型的更高限额[22] 辅助功能与未来规划 - 谷歌同步推出AI内容溯源功能,用户可上传图像查询是否由谷歌AI生成,该功能未来将扩展至音频和视频[6][21] - 谷歌为AI生成图像添加水印,免费或Pro方案用户创建的图像带可见水印,最高价Ultra方案用户可移除可见水印[21] - 公司计划继续扩大AI产品规模,重点包括AI电影制作工具Flow和"世界构建"模型Genie[23]