马斯克视频生成模型首次交卷！电影级运镜+音效，免费可玩

产品发布与核心能力 - xAI公司正式全面上线其“迄今为止最强大的视频音频生成模型”Grok Imagine 1.0版本 [1] - 模型支持文生视频和图生视频，单次生成时长为10秒，分辨率为720P，音频效果实现大幅提升 [1] - 模型核心能力分为视频生成与视频剪辑两大板块，具备电影级运镜理解、画面衔接丝滑、多主体生成与互动自然、精准指令遵循等特点 [1] - 模型支持竖屏与横屏格式，适配各平台画面比例，并允许用户用自己的动作表演驱动角色生成动画 [1] - 在视频剪辑方面，模型支持在视频中添加或删除对象、替换对象、切换场景氛围、修改物体颜色与细节、更换视觉风格，甚至能将静态黑白线稿转化为动画 [1][3] 市场表现与用户采用 - 在过去的30天测试期内，Grok Imagine已生成12.45亿条视频 [1] - 模型已发布API，官网可免费使用，用户已开始进行多样化创作，例如生成小机器人跳舞、还原经典动画场景等 [11] 性能与基准测试 - 根据AI基准测试机构Artificial Analysis的文生视频排名，Grok Imagine综合排名第一，在成本和延迟两项关键指标上表现最优 [3] - 在Artificial Analysis和LMArena两家机构的评估中，Grok Imagine在延迟和成本上均处于领先位置 [4] - 在图生视频方面，Grok Imagine同样保持了高评分、低延迟和低成本的综合优势 [6] - 在针对视频编辑能力的人工盲评基准测试（使用IVEBench数据库）中，Grok Imagine在整体表现、指令遵循度、效果一致性三大维度均领先 [9]