镜像关系
搜索文档
火爆全网的《卢浮宫小猫》AI视频万字创作心得分享,这可能是他们最毫无保留的一次。
数字生命卡兹克· 2026-01-16 09:25
文章核心观点 - 文章详细记录了数字艺术家海辛与阿文为浦东美术馆卢浮宫大展创作AI宣传片《卢浮宫小猫》的全流程,分享了从创意、选角、定调、音乐、分镜、美术到动画的完整方法论与实战经验,旨在展示AI工具在专业影视创作中的高效应用与艺术潜力 [8][9][24] - 创作者强调,尽管当前AI模型能力强大且便捷,但专业创作者更应借此追求更高的艺术标准,通过深入的手工构思与分次迭代来控制作品质量,而非依赖AI代理一键生成,模型越方便越要逼自己做得更好 [165][166] 选角与故事设定 - 项目最初主角设定为与浦东美术馆黑白主题色匹配的奶牛猫,故事围绕一幅油画展开,但因宣传周期长需两支短片,追车情节会导致调性偏离“美术馆官方宣传片”气质而被整体弃用 [27][28][30] - 最终确定主角为一白一橘两只猫,白猫代表法国,橘猫延续其作为“上海代言”的属性,此设定既保证了主角视觉明亮以吸引观众眼球,也呼应了之前的作品系列 [32] - 影片分为上下两支,上半支讲述法国小白猫来上海的故事,下半支讲述浦东代言橘猫去看展的故事,两支短片均围绕实际展品(孔雀纹样盘与“赛诗会诗版”)进行叙事设计 [19][20][22] 影片定调与音乐设计 - 创作早期即确定影片“调性”,包含核心画面影调与音乐两部分,音乐能直接引导观众感受并反向决定剪辑节奏 [36] - 受浦东美术馆“镜厅”启发,确立了“镜像”核心概念,用以结构卢浮宫与浦东美术馆、上海与巴黎、两只小猫之间的关系,早期探索了分屏动画形式 [39][41] - 主乐器选择钢琴,原因一是其干净的和弦与“水波纹”倒影质感联想契合,二是镜厅的格子结构让人联想到钢琴键盘的秩序感 [46] - 叙事类短片配乐需要“弧线”以匹配故事的起承转合,结构包括开篇引入、展开叙述、转折、高潮旋律和专门补写的收尾(outro) [47][49] - 使用Suno生成和编辑音乐,因其可对片段进行细致控制,如规定旋律长度和特定时间点的情绪,并通过调整“音频影响度”(Audio influence)在保留基础旋律上进行变奏,例如为上海篇加入萨克斯以营造老上海爵士感 [50][52] 分镜构思与叙事节奏 - 开篇分镜要求“信息量高”,力求在前三个镜头内讲清故事,例如第一个镜头暗示故事核心(如猫与海报),第二个特写介绍主角,第三个全景交代环境与镜像关系 [57][59][60] - 分镜节奏感来自景别的变化,避免全景接全景的单一感,通过全景与特写的切换形成收放感,并用简单动画引导观众视线 [62] - 在展示白猫喜爱孔雀纹样盘的奇幻段落中,通过镜头运动与构图设计引导注意力:用卢浮宫经典雕塑(如胜利女神像)作背景点缀,采用极端仰拍使前景白猫占据更大体积,强迫观众关注猫的同时识别地点 [67] - 为保持观众注意力始终跟随主角,会刻意拿掉容易“抢戏”的元素,如画框中的人像 [70] - 高潮后的“回转现实”处理简洁,通过切回猫的特写再切至客观镜头,让观众明白奇幻段落源自猫的幻想 [71] - 对于信息量大的段落(如展品运输),采用蒙太奇和分屏处理,并避免出现人脸以防止观众注意力被转移 [76] - 转场设计注重“意向连续”,例如前后镜头都出现飞机意向,即使风格从写实跳至马赛克艺术也不会让观众感到突兀 [83] 美术风格与AI工具应用 - 美术原则是“第一眼要好看(电影感),第二眼要耐看(丰富的细节)” [97] - 为契合卢浮宫伊斯兰艺术展主题,深入研究了该艺术风格,并总结出“伊兹尼克风格”(Iznik style)和“马赛克艺术”(Mosaic art)等高效关键词 [96] - 选对AI模型被类比为“选对乙方”,目前生图主力是Nano Banana Pro,也用于大部分修改,部分配合Photoshop手动细调 [100] - 展示了AI高效修改的能力,例如项目中途将主角从黑猫全部改为白猫,使用早期工具耗时一天半完成所有镜头修改,而使用Banana Pro后可通过一句话指令批量完成,效率更高 [102][105][107] - 提示词撰写趋向简化,依赖模型的多模态理解能力,例如直接上传图片让AI提取元素并转换风格,而非撰写长篇提示 [111] - 对于复杂创意(如“猫在水边跑,倒影是孔雀”),必须分步迭代:先构建透视草图,生成基础场景;再逐步添加细节(如铺地砖、加入展品);最后处理动画,而非一次性交给AI生成 [120][122][123][124][127][129] - 提升AI合成成功率的技巧包括:先裁剪素材再生成以使模型更聚焦;对于需要多次复用的主体(如猫、蝴蝶),先将其提取到纯色背景再更换背景,避免模型“吃掉”主体或改变其外观 [132][137] - Photoshop的“协调”功能在合成时用于自动匹配环境光影,提升效率,但整体使用频率在降低 [141][143] - 对于需要高度确定性的地标或展品镜头,常采用将AI生成的猫合成到真实场景照片上的方法 [131] 动画制作与视频工具 - 主力视频工具是Google的Flow,常用模型是Veo 3.1,因其画面更具电影感,辅助使用可灵、海螺、即梦、万相、Ruma等 [147] - Flow的涂鸦功能可有效指导角色动作,例如在首帧上画运动路径并附加提示词,能让猫按指定方向走出画外 [149][152] - 认为当前已进入可以“P视频”的时代,Flow的隐藏编辑功能允许在生成视频中添加、删除元素,甚至改变摄像机运镜 [150] - Luma的Ray3在测试中表现出强大的视频合成与质量提升能力,但生成速度较慢 [153] - 万相(Wan)2.6的“新建角色”功能对动物角色生成效果出色,能基于一段模糊视频创建高清、被“主人认可”的角色,并用于新场景表演 [154] - 制作落版(结尾)微动效时,有时会选用动态幅度较小的上一代模型,以避免新模型过度发挥导致动效夸张 [157] 创作流程与废稿反思 - 创作流程遵循“先定画面与音乐调性,再推进分镜”的顺序 [34][36] - 对于关键镜头,采用“先确定尾帧(高潮画面),再反推设计首帧和镜头运动”的方法,以收敛想象,使镜头可控 [70] - 在情节未完全确定时,会用Sora等工具跑样例以快速测试节奏和构图,但最终是否采用取决于其是否符合既定影调与叙事逻辑 [80] - 废稿量巨大,尤其在效率工具升级后探索更多,例如曾尝试制作上海特色的“蝴蝶酥”镜头、卢浮宫内的夸张动效以及利用光影构成蝴蝶的创意镜头,均因动态实现困难或风格不符“低调奇幻”的基调而放弃 [160][162][164][167]