Sora 2干翻Veo 3？超全对比实测：会中文脱口秀，但体操翻车，附有效邀请码

Sora 2 性能提升 - 相比于旧版本，Sora 2在物理准确性、真实感和可控性方面都更胜一筹，并具备音画同步能力 [1] - Sora 2生成的视频没有物体相互穿透或无故消失，人物手指未出现畸变，且能自动生成连贯的评论音频 [5] - 模型可直接生成最长20秒的1080p视频 [7] 与谷歌Veo 3的对比测试 - 在诺曼底士兵场景中，Veo 3严格遵循文本描述，雨水效果更逼真，人物运动幅度更大，而Sora 2省略了“跪下”等部分动作 [16][17] - 在ASMR和男歌手场景中，两个模型均能实现精准的音画同步，细节处理到位，效果惊艳足以以假乱真 [20][22] - 在假新闻场景中，Sora 2胜出，其视频包含演播室主播和现场镜头切换，使内容更像真正的新闻报道，而Veo 3画面较模糊 [24][25] - 在中文脱口秀场景中，Sora 2能根据中文提示词自动生成中国演员及对应口型，但提示词中夹杂的英文发音不准；Veo 3目前仅支持英语提示，无法成功生成 [27] 技术局限性与挑战 - 在生成体操视频时，Sora 2和Veo 3均出现翻车，如动作突然倍速、多出胳膊或手臂旋转异常等物理错误 [28][29][31][33] - 有观点指出，当生成的视频长度加倍时，文本到视频生成器的能耗会增加四倍，引发对计算资源用于此类应用而非癌症研究等领域的资源错配担忧 [9][10] 产品化与市场策略 - Sora 2目前可通过网页端或iOS App（美加地区）免费使用，但需要邀请码和美区IP [11][12] - OpenAI为Sora 2采取了邀请制、安全水印及限制公众人物深度伪造等安全措施，以防止滥用，App常因版权保护等原因拒绝生成视频 [35] - OpenAI推出了基于自拍的客串功能，并推出了设计极似TikTok的Sora iOS应用，包含推荐算法驱动的视频流和社交互动功能 [39][42][44] - 有分析认为，通过应用程序建立产品壁垒可使公司在模型指标暂时落后时，仍能握住用户入口和使用习惯 [46]