Workflow
Nano Banana 2突然现身,能画公式解数学题,监控画面都能伪造
36氪·2025-11-11 10:14

Nano Banana 2代产品能力 - 预览版展示的能力远超第一代,在处理复杂提示方面表现突出,包括精确的文本渲染、超逼真的场景以及精细模拟的完整桌面界面[4] - 产品在真实性、生成速度和自然交互控制方面进行全面升级,能够生成极其复杂的用户界面,文字渲染无破绽[6] - 对物理常识与遵循提示词的细节表现良好,例如能同时准确绘制出指向特定时间的时钟和一杯斟满的红酒[8] - 具备一定的世界知识与逻辑推理能力,在解决数学问题的对比测试中,第二代的结果给人印象深刻,而第一代渲染出的公式基本无法理解[12] 第一代Nano Banana的市场表现与核心优势 - 第一代产品于2025年8月中旬匿名出现在AI模型测评平台LMArena,凭借出色的图像编辑能力迅速登顶排行榜[15] - 上线不到10天,用户编辑了超过2亿张图片,为Gemini应用带来了1000万新用户,并一度帮助Gemini超越ChatGPT成为苹果免费应用榜首[16] - 核心优势在于强大的图像编辑和理解能力,包括自然语言编辑与角色一致性,解决了AI图像编辑中常见的“身份漂移”问题[17] - 基于谷歌TPU v5架构优化,平均响应时间仅为1.3秒,单张图片生成成本约0.039美元,仅为DALL-E 3的十分之一[19] - 增加了多图像融合与风格迁移功能,支持将多张不同图片无缝融合成一张连贯的图像,或将一张图的风格应用到另一张图的物体上[21] 公司战略与产品整合 - 谷歌加速将Nano Banana整合进其核心产品生态,除了在Gemini应用和AI Studio中提供服务外,已开始测试将其集成到Google Photos、搜索、智能镜头和画圈搜索中[19]