马斯克视频生成模型首次交卷!电影级运镜+音效,免费可玩
搜狐财经·2026-02-03 16:12
产品发布与核心能力 - xAI公司正式全面上线其“迄今为止最强大的视频音频生成模型”Grok Imagine 1.0版本 [1] - 模型支持文生视频和图生视频,单次生成时长为10秒,分辨率为720P,音频效果实现大幅提升 [1] - 模型核心能力分为视频生成与视频剪辑两大板块,具备电影级运镜理解、画面衔接丝滑、多主体生成与互动自然、精准指令遵循等特点 [1] - 模型支持竖屏与横屏格式,适配各平台画面比例,并允许用户用自己的动作表演驱动角色生成动画 [1] - 在视频剪辑方面,模型支持在视频中添加或删除对象、替换对象、切换场景氛围、修改物体颜色与细节、更换视觉风格,甚至能将静态黑白线稿转化为动画 [1][3] 市场表现与用户采用 - 在过去的30天测试期内,Grok Imagine已生成12.45亿条视频 [1] - 模型已发布API,官网可免费使用,用户已开始进行多样化创作,例如生成小机器人跳舞、还原经典动画场景等 [11] 性能与基准测试 - 根据AI基准测试机构Artificial Analysis的文生视频排名,Grok Imagine综合排名第一,在成本和延迟两项关键指标上表现最优 [3] - 在Artificial Analysis和LMArena两家机构的评估中,Grok Imagine在延迟和成本上均处于领先位置 [4] - 在图生视频方面,Grok Imagine同样保持了高评分、低延迟和低成本的综合优势 [6] - 在针对视频编辑能力的人工盲评基准测试(使用IVEBench数据库)中,Grok Imagine在整体表现、指令遵循度、效果一致性三大维度均领先 [9]