每一幕皆可控!字节发布多主体视频生成神器,人人皆主角
量子位·2025-06-13 17:02
仅基于一张参考图像,生成 主 体保持高 度一致 的视频, 多人同台也不串脸 ! 字节发布多主体视频生成神器—— MAGREF (Masked Guidance for Any‑Reference Video Generation) 。 比如,爱因斯坦版风驰电掣**摩托,效果be like: 字节 投稿 量子位 | 公众号 QbitAI 提供一张图灵 的参考图,也能生成动起来的全身视频,人物面貌服饰在每一帧中保持高一致性,不会逐渐跑 偏: 根据多样文 本 提示,MAGREF可实现"一图千面": 重要 的是, 不 仅是单一主体生成 。 无论输入 是谁、 来自哪个时 代、风格是否抽象,它都能精准复刻其身份特征,同时根据文本指令渲染出多变 的动作、环境和光影氛围。 MAGREF在不增加模型复杂度的前提下,通过引入掩码引导与通道拼接机制,实现了对多 样参考图像的统一处 理能力。 无论是 单 人演绎、多人物互动,还是人物与物体、背景共同出现在画面 中 ,MAGREF都能生成身份稳定、结 构一致、语义协调的视频序列。 牛顿纵情挥笔绘制大作: 每一位角色的面貌、发型、神态与参考图一致,表情自然,互动合理。 不论是两人同框还是 ...