每一幕皆可控！字节发布多主体视频生成神器，人人皆主角

仅基于一张参考图像，生成主体保持高度一致的视频，多人同台也不串脸！字节发布多主体视频生成神器—— MAGREF （Masked Guidance for Any‑Reference Video Generation）。比如，爱因斯坦版风驰电掣**摩托，效果be like：字节投稿量子位 | 公众号 QbitAI 提供一张图灵的参考图，也能生成动起来的全身视频，人物面貌服饰在每一帧中保持高一致性，不会逐渐跑偏：根据多样文本提示，MAGREF可实现"一图千面"：重要的是，不仅是单一主体生成。无论输入是谁、来自哪个时代、风格是否抽象，它都能精准复刻其身份特征，同时根据文本指令渲染出多变的动作、环境和光影氛围。 MAGREF在不增加模型复杂度的前提下，通过引入掩码引导与通道拼接机制，实现了对多样参考图像的统一处理能力。无论是单人演绎、多人物互动，还是人物与物体、背景共同出现在画面中，MAGREF都能生成身份稳定、结构一致、语义协调的视频序列。牛顿纵情挥笔绘制大作：每一位角色的面貌、发型、神态与参考图一致，表情自然，互动合理。不论是两人同框还是 ...