一手实测全新的Sora 2 - AI视频的ChatGPT时刻到来了。

Sora 2模型技术突破 - 模型被描述为AI视频的"ChatGPT时刻"，是原生视频和音频生成模型，效果远超Veo3 [3][4] - 在物理运动真实性上取得显著进步，能够完成高难度动作如奥运体操、桨板后空翻和打排球，被视为当前运动质量和物理规律最顶尖的水平 [5][7][8][19] - 人物表演与一致性结合多模态音频能力达到新高度，可实现极度真实的人物表演和近乎完美的音频生成，环境声、风声、碰撞声等多人在场音频几乎无错误 [21][24][28] - 支持用户身份验证生成固定数字人分身（ID），并在后续生成中调用该角色，确保人脸一致性完美还原 [22][23][28] - 从代码分析显示存在Sora 2和Sora 2 Pro两款模型，类比可灵的标准版和高品质版 [29] - 初始版本存在限制：仅限美国和加拿大ChatGPT Pro用户通过邀请码使用，输出为10秒视频，清晰度低至360P，且仅有横屏和竖屏选项 [30][31] Sora APP产品特性 - 产品定位为社交驱动的AI视频应用，被比喻为"AI版抖音"，但核心差异在于其社交属性，旨在成为与朋友交流的新方式 [4][33][37][47] - 核心功能"出镜秀（cameos）"允许用户@好友的数字分身进行视频共演，例如让特定角色在餐厅共进晚餐，开创了整蛊朋友和内容再混合的新玩法 [37][39][46][47] - 产品设计强调社交互动，用户可刷公域AI视频、点赞、转发、关注，交互界面与抖音类似，首批用户可获得4个邀请码分享以促进社交场景使用 [33][34][37] - 身份验证流程严格，创建个人cameo需录制动态音频、完成随机音频挑战并通过活体检测，确保使用者为本人，并可设置cameo的呈现偏好 [39][41][44] - 尽管模型技术进步显著，但亚洲人脸部ID保持效果仍一般，为欧美公司通病，且生成效果存在不稳定性 [46]