OpenAI突然发布Sora 2：好一个“AI版抖音”！

Sora 2模型核心能力升级 - 模型定位从Sora 1的“GPT-1时刻”跨越至“GPT-3.5时刻”，实现代际飞跃 [6] - 升级为音视频同步生成模型，生成的视频自带配音 [5] - 物理模拟能力显著增强，能更好地遵循物理定律，例如人物动作丝滑连贯，物体运动轨迹自然 [7][8][10] - 可控性更强，能处理涉及多个镜头的复杂提示词，并保持虚拟世界的逻辑一致性 [11] - 支持将现实世界元素注入视频，通过观察某人视频即可将该形象植入Sora生成的任何环境 [14] Sora iOS应用：AI短视频平台 - 应用定位为完全由AI生成视频的短视频平台，被类比为“AI版抖音” [1][2][35] - 用户可创作AI内容、对他人生成内容进行二次创作，并在可自定义信息流中发现视频 [15] - 核心功能“客串”允许用户经身份验证后，将自己或朋友的形象置入Sora生成的环境 [15][20] - 用户对个人肖像拥有端到端完全控制权，可决定谁可使用其形象，并随时撤销授权或删除相关视频 [24][38] - 应用率先在北美地区启动初始推送 [33] 实际生成效果与用户体验 - 生成视频画面逼真，水花飞溅、皮肤细节和神态处理达到电影级别，难以分辨真伪 [4][27] - 支持中文提示词，生成过程快速，约两分钟即可产出带配乐的视频 [22] - 可生成多种风格，包括吉卜力动漫风格、1960年代黑白新闻报道风格等 [12][28][29] - 当前普通版本存在画质较低的问题，但ChatGPT Pro用户可抢先体验更高质量的Sora 2 Pro模型 [23][31] 商业化与行业影响 - 官方计划后续发布Sora 2的API，为更广泛商用提供可能 [32] - 应用依托OpenAI现有大语言模型研发了全新类别的推荐算法，用户可通过自然语言调控信息流 [37] - 发布后与快手旗下可灵等现有AI视频应用形成直接竞争，引发效果对比 [42]