Workflow
Flux Kontext
icon
搜索文档
从手办到试穿,最适合普通人的Nano Banana玩法
36氪· 2025-11-27 18:02
产品发布与市场反响 - Google最新推出的图像模型与编辑模型Gemini 2.5 Flash Image,代号Nano Banana,于8月26日正式上线后迅速引爆社交媒体,获得大量博主和用户关注[2][3][6] - 该模型最初隐藏在LMArena"模型比武场"中,需要通过"抽卡"才能体验,由于抽中概率低,用户甚至研究出提高中签率的技巧,如上传照片后垫透明图[3] - 模型生成速度极快,通常只需十几秒就能完成一张图片的生成,符合其"快如闪电"的官方宣传点[5][6] 核心功能与技术特点 - 具备SOTA级别的图像生成和编辑能力,主打功能包括将平面图生成一整套摆放在桌上的手办模型图片,包含包装盒和显示模型的电脑屏幕,立体感和逼真程度高[3][5] - 拥有难以置信的角色一致性,用户上传人物图片后,通过简单指令如"改成长发"、"改成浅金色长直发"即可保持人物主体不变的情况下修改细节[9][11] - 模型基于Gemini架构,拥有世界知识,不仅能生成图像,还能识别图像内容并进行推理,如准确标注景点信息生成AR视觉介绍卡片[21][24] - 具备视觉推理能力,例如根据地图中的红色箭头方向生成该方向的真实世界景观,或根据等高线地形图绘制出指定位置的场景[27][29] 应用场景与用户案例 - 手办生成:用户可将游戏角色平面图转化为立体手办模型图片,展示高度立体化的衣服褶皱、纹理和光影效果[7][9] - 虚拟试衣:解决网购痛点,用户上传全身照和单品图,可生成穿着效果图进行云试穿,如将西装外套替换为大花棉袄并保持其他部分不变[12][14] - 场景替换:支持换人、换景功能,如将照片中的人物替换为特朗普,并将背景改为海边,创造虚拟场景[18][20] - 家装设计:与Lovart等平台结合,用户通过简单示意图即可将家具放入房间指定位置生成效果图,简化装修设计流程[33] - 内容创作:可将任意建筑转换为等距风格图标,根据手绘动作示意图调整人物姿态,甚至生成多张分镜图片用于漫画制作[34][35][36] 竞争优势与市场定位 - 相比同类产品Flux Kontext,Nano Banana在人物一致性方面表现更优,且操作门槛更低,不需要复杂工作流,直接对话即可出图改图,支持多轮互动[31][32] - 与国内豆包相比,虽然豆包在中文语境和生态绑定上有优势,但生成图像带有较浓AI感,人脸细节和一致性不够自然[31] - 市场定位清晰:Flux面向专业设计师追求画面质感,豆包适合职场人快速生成展示图,Nano Banana则定位全能派,兼顾创意性和易用性,适合博主、手办玩家等创意用户[32] 技术演进与未来展望 - 模型研究员提出未来发展的两条主线:Smartness(更聪明)与Factuality(更靠谱),旨在提升指令理解能力和输出准确性[38] - 计划开发"自动化个人审美打分器",让模型逐步学习用户审美偏好,实现个性化输出[38] - 当前多样化的应用场景只是起点,模型正从"炫技工具"向"日常工具"转变,用户不断重塑其使用边界[33][38]
人物一致性新王Nano Banana登基,AI图片编辑史诗级升级。
数字生命卡兹克· 2025-08-19 09:05
AI绘图模型Nano Banana评测 核心观点 - Nano Banana在人物一致性、背景替换、细节修改等方面表现远超其他AI绘图模型,成为当前一致性最强的AI生图工具 [1][6][82] - 该模型疑似由Google DeepMind开发,目前仅在LMArena平台通过随机盲测形式出现,尚未正式发布 [25][11][13] 模型性能对比 - **人物一致性**:Nano Banana能完美保留面部特征、表情细节和服饰元素,其他模型如GPT-4o存在泛黄滤镜、Flux Kontext擅自修改表情、即梦错误改变人脸结构 [6][37][55] - **多主体处理**:在将《罗马假日》主角替换为川普和马斯克的测试中,Nano Banana准确还原人物特征,Flux生成双胞胎,GPT-4o面部失真,即梦遗漏主体 [43][47] - **背景替换**:Nano Banana生成的末日废墟场景具有真实光影和丰富细节,Flux/GPT-4o背景糊化,即梦添加无关程序猿元素 [49][51] - **风格转换**:在赛博朋克、梵高风格、水墨画转换测试中,Nano Banana保持最高完成度和人物一致性 [72][75][77] 技术应用场景 - 视频封面制作:通过单张照片+提示词即可生成多动作版本,成功率显著高于需反复抽卡的其他模型 [80][7] - 手办设计:实现2D转3D、添加特效背景等操作,被用户用于制作梦幻联动内容 [15][18][20] 行业动态 - 当前AI绘图领域主要竞争者包括GPT-4o、Flux Kontext、即梦等,但Nano Banana的出现可能重塑竞争格局 [12][79] - Google通过匿名测试新模型的方式收集用户反馈,显示其技术储备领先行业 [10][25] 使用方式 - 需通过LMArena平台的battle模式随机触发,输入prompt和参考图后由系统盲选模型生成,用户无法主动选择Nano Banana [26][28][33]