公司产品发布与定位 - xAI发布最新视频生成模型Imagine v0 9并免费向所有用户开放 [1] - 此次发布被视为对OpenAI一周前发布旗舰视频和音频生成模型Sora 2的直接回应 [1] - Imagine v0 9集成到Grok中 可根据文字生成图片再创建视频或将用户上传图片变成视频 [5] 产品性能与技术特点 - Imagine v0 9的视频生成时间不到20秒 用户可通过语音优先界面创建视频、图像和文本 [1] - 模型在视觉质量、动作、音频生成方面相比初代版本有所升级 [1] - 模型突破原生音频+视频生成界限 支持开箱即用创建类似电影效果的视频 [5] - 主要升级点包括运动控制使动作丝滑、支持添加动态相机效果如智能焦点转移、支持添加自然对话或生成表现力歌声 [5] - Imagine v0 9生成的视频时长在6秒左右 而Sora 2支持15秒视频生成 [3] 市场竞争与产品对比 - Imagine v0 9生成速度在20秒以内 Sora 2生成视频可能需要一两分钟 [3] - Imagine v0 9已免费开放 Sora 2采用邀请制允许部分用户使用 [3] - 对比测试显示Imagine v0 9存在提示词理解错误、视频画面与音频不符、无法说中文等情况 [3][6][7] - 在特定提示词测试中 Imagine v0 9生成的视频音频未包含关键元素如“喊叫” 或出现无视重力的动作 [6] 技术团队与人才动向 - 此次发布是马斯克今年7月挖走英伟达高级算法工程师何宜晖后 其在xAI参与的第一个项目 [3] - 何宜晖曾参与英伟达世界基础模型Cosmos研发 拥有卡内基梅隆大学计算机视觉硕士学位 [3] 产品可用性与潜在风险 - Imagine v0 9的Web端目前无法正常工作 移动端可体验但会出现连接失败情况 [4] - 模型的自定义语音功能允许用户上传公众人物照片及说话内容生成视频 技术成熟后可能带来深度伪造风险 [8] - 在测试中 该功能生成的声音与名人本人略有区别 且未提示深度伪造风险 [7]
硬刚Sora 2,马斯克发视频大模型,免费可玩,前英伟达何宜晖参与