Workflow
腾讯混元「图生视频」
icon
搜索文档
腾讯图生视频全面开源,更懂物理规律,一手实测来了
量子位· 2025-03-06 16:29
文章核心观点 腾讯版Sora推出图生视频功能且发布即开源,新功能在画质等方面有提升,经实测在多个难题挑战上有进步但仍有完善空间 [1][2][37] 分组1:功能介绍 - 腾讯版Sora补齐图生视频功能,和文生视频模型HunyuanVideo一样发布即开源 [1][2] - 新功能在画质、物体一致性等方面有很大提升,已上线腾讯混元AI视频,人人可免费体验(有次数限制) [3][4] 分组2:实测情况 难题1:是否符合现实物理规律 - 让腾讯混元视频AI还原运动员跳水,整体画面较高清,质量相比早期有明显进步,但细节经不起推敲,目前生成视频只有5秒 [10][13][17] 难题2:能否“无中生有” - 输入“图中出现了一匹马”,视频中出现白色骏马;暂时无法在视频中凭空生成文字,可先在图片中生成文字再转换成动态视频 [19][21][22] 难题3:能否准确遵循指令 - 用图片搭配文字提示词考察,腾讯混元视频AI可通过正反提示词设计画面,测试镜头切换功能时衔接较自然,但整体一致性有完善空间 [25][26][30] 难题4:能否保证连贯一致性 - 镜子题材测试中,生成效果惊艳,镜子内外主体运动一致,光影变换符合物理规律,整体丝滑 [33][36][37] 分组3:提示词用法 - 提示词=主体+动作,主体与输入图片一致,简单描述,动作描述用词简单清晰具体有动态感 [38][39] - 提示词=主体+动作+运镜方式,运镜方式指镜头运动方式 [40] 分组4:网友体验与链接 - 网友进行鲜测,可通过链接在线免费体验、查看Github和Huggingface相关内容 [41][42]