Workflow
FlowDirector
icon
搜索文档
单卡4090也能高质量视频编辑!西湖AGI Lab无训练框架FlowDirector来了
机器之心· 2025-06-14 12:12
研究背景与挑战 - 当前视频编辑方法基于反演技术,存在时序不一致、结构失真和编辑幅度受限三大问题[10] - 反演误差导致帧间连贯性破坏,背景漂移现象严重,且无法兼顾大幅语义变换与细节保真[11] 技术方案 - FlowDirector采用直接流演化路径,绕过反演阶段,通过ODE平滑过渡实现语义转换[10] - 引入空间感知流矫正(SAFC),通过注意力热图生成二值掩码,仅对目标区域施加编辑流[13][15] - 提出差分平均引导(DAG),通过高质量采样与基线采样的差异比对,自动优化编辑方向[16][17] 技术优势 - 编辑质量更高:支持大幅度形变,允许彻底的对象编辑[2] - 功能更广泛:支持添加、删除、纹理替换等多种复杂操作[2] - 计算效率突出:单卡4090即可实现高质量编辑,无额外显存开销[2] 实验结果 - 在WarpSSIM等指标上全面超越FateZero、TokenFlow等SOTA方法[26][27] - 能精准反映文本提示的关键风格属性,保持背景稳定性和时序连贯性[24] - 支持主体替换、属性修改、局部增删等复杂操作,视觉效果与语义高度对齐[22] 应用前景 - 框架可直接应用于影视后期、短视频创作、AR/VR内容生成等领域[28] - 开源项目已发布在GitHub和Huggingface平台,便于社区协作开发[8]
SOTA级视频编辑新方法:无需训练一句话编辑视频,背景保持100%
量子位· 2025-06-10 13:16
FlowDirector团队 投稿 量子位 | 公众号 QbitAI 传统的视频编辑工作流,正在被AI彻底重塑。 开销低:FlowDirector无反演过程,不需要存储任何额外的控制信息(如Attention Map),单卡4090就可实现高质量视频编辑。 支持广泛:除可进行传统的对象替换外,FlowDirector可以任意的添加、删除视频中的内容,以及进行一系列的纹理替换。 背景100%保持:通过对非编辑区域的"动力"进行冻结,使得编辑后的视频在无关区域与原视频完全保持一致。 方法:针对视频编辑中的「反演痛点」 现在的通用视频编辑方法大多基于反演-去噪(inversion-denosiong)范式: AI的视频编辑方法总是存在一些问题:例如视频运动不连贯、编辑后的视频产生意外变化等……经过分析,这些问题的产生最终大都指向同一 原因—— 反演-编辑范式 。 因此, 西湖大学AGILab 提出了一种全新的无需反演和训练的视频编辑新方法: FlowDirector 。 相较于其他视频编辑方法,FlowDirector有以下方面值得关注: 编辑结果展示: 这种范式带来了许多问题:反演过程中的错误会不断的累计,使得得 ...