Workflow
一手实测全新的Sora 2 - AI视频的ChatGPT时刻到来了。
数字生命卡兹克·2025-10-01 05:22

Sora 2模型技术突破 - 模型被描述为AI视频的"ChatGPT时刻",是原生视频和音频生成模型,效果远超Veo3 [3][4] - 在物理运动真实性上取得显著进步,能够完成高难度动作如奥运体操、桨板后空翻和打排球,被视为当前运动质量和物理规律最顶尖的水平 [5][7][8][19] - 人物表演与一致性结合多模态音频能力达到新高度,可实现极度真实的人物表演和近乎完美的音频生成,环境声、风声、碰撞声等多人在场音频几乎无错误 [21][24][28] - 支持用户身份验证生成固定数字人分身(ID),并在后续生成中调用该角色,确保人脸一致性完美还原 [22][23][28] - 从代码分析显示存在Sora 2和Sora 2 Pro两款模型,类比可灵的标准版和高品质版 [29] - 初始版本存在限制:仅限美国和加拿大ChatGPT Pro用户通过邀请码使用,输出为10秒视频,清晰度低至360P,且仅有横屏和竖屏选项 [30][31] Sora APP产品特性 - 产品定位为社交驱动的AI视频应用,被比喻为"AI版抖音",但核心差异在于其社交属性,旨在成为与朋友交流的新方式 [4][33][37][47] - 核心功能"出镜秀(cameos)"允许用户@好友的数字分身进行视频共演,例如让特定角色在餐厅共进晚餐,开创了整蛊朋友和内容再混合的新玩法 [37][39][46][47] - 产品设计强调社交互动,用户可刷公域AI视频、点赞、转发、关注,交互界面与抖音类似,首批用户可获得4个邀请码分享以促进社交场景使用 [33][34][37] - 身份验证流程严格,创建个人cameo需录制动态音频、完成随机音频挑战并通过活体检测,确保使用者为本人,并可设置cameo的呈现偏好 [39][41][44] - 尽管模型技术进步显著,但亚洲人脸部ID保持效果仍一般,为欧美公司通病,且生成效果存在不稳定性 [46]