刚刚，OpenAI Sora 2重磅登场！首个APP上线，或将成为AI时代新TikTok

产品发布 - OpenAI正式发布新一代AI视频模型Sora 2 在物理准确性、逼真度和一致性上实现重大飞跃并首次实现音画同步功能[3][4] - Sora 2被官方称为开启视频领域的GPT-3.5时刻标志着AI视频生成技术进入新阶段[11] - 公司同步推出iOS端Sora App 支持用户通过录制视频将个人形象投射到生成场景中实现全新社交互动方式[8][34] 技术突破 - 模型在物理细节准确性上显著进化能够合理模拟物体运动惯性、受力和材质例如篮球打板弹开或投丢等符合物理规律的效果[12][17] - 实现多镜头连续生成能力确保角色服饰、光线、道具等世界状态在不同镜头间保持连贯性避免穿帮现象[24] - 支持音画同步功能生成对白与口型精准对齐并可模拟复杂环境声效音频效果几乎无法分辨为AI生成[4][19][28] 应用功能 - 新增Cameo功能允许用户将自身形象融入视频故事可实现与熊猫打乒乓或赋予飞行超能力等创意场景[34][37] - 模型支持多种风格生成包括写实电影质感、日漫超现实风格以及吉卜力动画风格满足不同创作需求[24][26][29] - 提供精细化镜头控制用户可像导演一样指定镜头顺序、节奏和景别变化直接生成连贯成片[24] 性能表现 - 模型通过业界称为AI体操界图灵测试的挑战能准确生成体操运动员在平衡木上翻转等高难度动作[13][15] - 开发者实测显示Sora 2在动漫效果渲染和极致运镜方面表现卓越从近景拉远镜头完全无违和感[42][43] - 内测用户反馈模型生成内容一致性极高人物角色在不同镜头中保持稳定接近好莱坞级制作水平[8][44] 安全治理 - 系统部署三层审核机制对文本提示、上传素材及生成视频进行全流程分层拦截重点保护未成年人场景[54] - 严格管理肖像权禁止未授权使用他人视频换脸且所有涉及用户形象的作品均可被追溯和撤回[54] - 采用动态水印和元数据嵌入技术确保内容可追溯性并开发专用工具检测AI生成内容[54] 团队背景 - 项目负责人Bill Peebles为95后研究员拥有MIT本科和加州伯克利博士学位此前在英伟达、Adobe、Meta等公司有AI实习经历[58][59][60] - 开发团队阵容豪华几乎涵盖OpenAI所有员工显示出公司对该项目的高度重视[56][58] 行业影响 - 技术突破将影响影视广告、动画分镜、教育科普及产品演示等多个行业并为未来AI机器人训练提供支持[62] - 模型分发逻辑注重二创价值通过自然语言交互调整推荐内容可能重塑社交媒体内容生态[40] - 当前以邀请制在美加地区首发高质量Pro版本专供ChatGPT Pro用户 API接口即将开放[40][42]