Workflow
谷歌又赢了,nano banana「被迫」改名后,网友搞出7种神仙玩法
机器之心·2025-08-28 18:40

模型发布与性能 - 谷歌推出Gemini-2.5-flash-image模型 原名为nano banana 生成速度更快 成本更低 图像生成与编辑能力更强 被网友称为世界上最好的AI照片编辑器[2][5] - 模型已在Gemini应用和Google AI Studio上线 用户可免费体验 开发者可通过Gemini API调用[5] 功能与应用场景 - 制作等距模型:将建筑或物体转化为等距模型 自动补全建筑细节如墙皮和电线 但存在人物数量不一致的问题[7][8][9] - 生成六视图:在白色背景上展示主体多个角度视图 保持主体一致和等距视角效果[12] - 标注现实世界:识别建筑并标注相关信息 经ChatGPT验证基本正确 仅少数细节不准确[15][18] - 红箭头视角生成:根据地图截图和箭头标记 生成指定位置和方向的真实景观图像 包括虚构混合城市地图[20][22][23] - 地形视图生成:先绘制带等高线的DEM 再从指定位置生成对应自然景观 高度还原湖泊山脉等地形特征[24][25][26] - 时尚穿搭识别:上传穿搭照片生成OOTD清单 支持真人和动漫角色 整体效果惊艳但存在配件遗漏或颜色错误[27][28][31][32] - 人物换衣:复杂图案T恤也能1:1复刻 褶皱逼真[33] - 电影分镜生成:上传肖像生成多帧电影镜头 支持多种风格 还能识别手绘姿势生成复杂战斗场景[37][40] - 漫画生成:将真实照片转为黑白漫画风格 添加动态效果和故事连贯性 如自动驾驶汽车照片出现猫和对话框[43][44] - 风格转换与照片修复:将照片转为《辛普森一家》等卡通风格 支持老照片修复和黑白照片上色[46][48][50] 市场反响与热度 - 模型热度居高不下 火爆程度不亚于GPT-4o掀起的吉卜力热潮[2] - 网友开发出多种新奇玩法 谷歌官方账号在X平台推荐使用方式[6][9]