Workflow
Sora 2干翻Veo 3?超全对比实测:会中文脱口秀,但体操翻车,附有效邀请码
机器之心·2025-10-01 15:26

Sora 2 性能提升 - 相比于旧版本,Sora 2在物理准确性、真实感和可控性方面都更胜一筹,并具备音画同步能力 [1] - Sora 2生成的视频没有物体相互穿透或无故消失,人物手指未出现畸变,且能自动生成连贯的评论音频 [5] - 模型可直接生成最长20秒的1080p视频 [7] 与谷歌Veo 3的对比测试 - 在诺曼底士兵场景中,Veo 3严格遵循文本描述,雨水效果更逼真,人物运动幅度更大,而Sora 2省略了“跪下”等部分动作 [16][17] - 在ASMR和男歌手场景中,两个模型均能实现精准的音画同步,细节处理到位,效果惊艳足以以假乱真 [20][22] - 在假新闻场景中,Sora 2胜出,其视频包含演播室主播和现场镜头切换,使内容更像真正的新闻报道,而Veo 3画面较模糊 [24][25] - 在中文脱口秀场景中,Sora 2能根据中文提示词自动生成中国演员及对应口型,但提示词中夹杂的英文发音不准;Veo 3目前仅支持英语提示,无法成功生成 [27] 技术局限性与挑战 - 在生成体操视频时,Sora 2和Veo 3均出现翻车,如动作突然倍速、多出胳膊或手臂旋转异常等物理错误 [28][29][31][33] - 有观点指出,当生成的视频长度加倍时,文本到视频生成器的能耗会增加四倍,引发对计算资源用于此类应用而非癌症研究等领域的资源错配担忧 [9][10] 产品化与市场策略 - Sora 2目前可通过网页端或iOS App(美加地区)免费使用,但需要邀请码和美区IP [11][12] - OpenAI为Sora 2采取了邀请制、安全水印及限制公众人物深度伪造等安全措施,以防止滥用,App常因版权保护等原因拒绝生成视频 [35] - OpenAI推出了基于自拍的客串功能,并推出了设计极似TikTok的Sora iOS应用,包含推荐算法驱动的视频流和社交互动功能 [39][42][44] - 有分析认为,通过应用程序建立产品壁垒可使公司在模型指标暂时落后时,仍能握住用户入口和使用习惯 [46]