Workflow
ICCV高分论文|可灵ReCamMaster在海外爆火,带你从全新角度看好莱坞大片
机器之心·2025-07-23 18:36

视频生成技术 - 提出ReCamMaster模型 可对输入视频沿新相机轨迹重新运镜 解决无人机缺失或手抖导致的运镜问题 [2] - 模型支持用户上传任意视频并指定新相机轨迹 实现视频重运镜效果 [2] - 在4D重建 视频去抖动 自动驾驶 具身智能等领域具有应用潜力 [3] 技术创新点 - 核心创新在于提出新的video conditioning范式 将condition video与target video在patchify后沿时间维度拼接 [11] - 新范式相比传统通道维度拼接方法有显著性能提升 [11] - 首次实现单视频重运镜的准产品级性能 验证视频生成模型在此类任务的潜力 [13] 数据集资源 - 发布MultiCamVideo数据集 包含13,600个动态场景 每个场景由10个摄像机同步拍摄 [13] - 数据集总量达136,000个视频 包含112,000种不同相机轨迹 [13] - 数据集涵盖66个人物主体 93种人物动作和37个3D环境背景 [13] 性能验证 - 与最先进方法相比 ReCamMaster在视频生成质量上有大幅度性能提升 [15] - 生成视频能保持原视频场景和动态 在不同场景下展现良好泛化性 [11] 项目资源 - 开源项目代码 训练测试脚本及完整数据集 [4] - 提供论文链接和项目主页展示更多技术细节与案例 [4][11]