产品发布 - OpenAI正式发布新一代AI视频模型Sora 2 在物理准确性、逼真度和一致性上实现重大飞跃并首次实现音画同步功能[3][4] - Sora 2被官方称为开启视频领域的GPT-3.5时刻 标志着AI视频生成技术进入新阶段[11] - 公司同步推出iOS端Sora App 支持用户通过录制视频将个人形象投射到生成场景中实现全新社交互动方式[8][34] 技术突破 - 模型在物理细节准确性上显著进化 能够合理模拟物体运动惯性、受力和材质 例如篮球打板弹开或投丢等符合物理规律的效果[12][17] - 实现多镜头连续生成能力 确保角色服饰、光线、道具等世界状态在不同镜头间保持连贯性 避免穿帮现象[24] - 支持音画同步功能 生成对白与口型精准对齐 并可模拟复杂环境声效 音频效果几乎无法分辨为AI生成[4][19][28] 应用功能 - 新增Cameo功能允许用户将自身形象融入视频故事 可实现与熊猫打乒乓或赋予飞行超能力等创意场景[34][37] - 模型支持多种风格生成 包括写实电影质感、日漫超现实风格以及吉卜力动画风格 满足不同创作需求[24][26][29] - 提供精细化镜头控制 用户可像导演一样指定镜头顺序、节奏和景别变化 直接生成连贯成片[24] 性能表现 - 模型通过业界称为AI体操界图灵测试的挑战 能准确生成体操运动员在平衡木上翻转等高难度动作[13][15] - 开发者实测显示Sora 2在动漫效果渲染和极致运镜方面表现卓越 从近景拉远镜头完全无违和感[42][43] - 内测用户反馈模型生成内容一致性极高 人物角色在不同镜头中保持稳定 接近好莱坞级制作水平[8][44] 安全治理 - 系统部署三层审核机制 对文本提示、上传素材及生成视频进行全流程分层拦截 重点保护未成年人场景[54] - 严格管理肖像权 禁止未授权使用他人视频换脸 且所有涉及用户形象的作品均可被追溯和撤回[54] - 采用动态水印和元数据嵌入技术 确保内容可追溯性 并开发专用工具检测AI生成内容[54] 团队背景 - 项目负责人Bill Peebles为95后研究员 拥有MIT本科和加州伯克利博士学位 此前在英伟达、Adobe、Meta等公司有AI实习经历[58][59][60] - 开发团队阵容豪华 几乎涵盖OpenAI所有员工 显示出公司对该项目的高度重视[56][58] 行业影响 - 技术突破将影响影视广告、动画分镜、教育科普及产品演示等多个行业 并为未来AI机器人训练提供支持[62] - 模型分发逻辑注重二创价值 通过自然语言交互调整推荐内容 可能重塑社交媒体内容生态[40] - 当前以邀请制在美加地区首发 高质量Pro版本专供ChatGPT Pro用户 API接口即将开放[40][42]
刚刚,OpenAI Sora 2重磅登场!首个APP上线,或将成为AI时代新TikTok
创业邦·2025-10-01 11:48