Sora 2模型核心能力升级 - 模型定位从Sora 1的“GPT-1时刻”跨越至“GPT-3.5时刻”,实现代际飞跃 [6] - 升级为音视频同步生成模型,生成的视频自带配音 [5] - 物理模拟能力显著增强,能更好地遵循物理定律,例如人物动作丝滑连贯,物体运动轨迹自然 [7][8][10] - 可控性更强,能处理涉及多个镜头的复杂提示词,并保持虚拟世界的逻辑一致性 [11] - 支持将现实世界元素注入视频,通过观察某人视频即可将该形象植入Sora生成的任何环境 [14] Sora iOS应用:AI短视频平台 - 应用定位为完全由AI生成视频的短视频平台,被类比为“AI版抖音” [1][2][35] - 用户可创作AI内容、对他人生成内容进行二次创作,并在可自定义信息流中发现视频 [15] - 核心功能“客串”允许用户经身份验证后,将自己或朋友的形象置入Sora生成的环境 [15][20] - 用户对个人肖像拥有端到端完全控制权,可决定谁可使用其形象,并随时撤销授权或删除相关视频 [24][38] - 应用率先在北美地区启动初始推送 [33] 实际生成效果与用户体验 - 生成视频画面逼真,水花飞溅、皮肤细节和神态处理达到电影级别,难以分辨真伪 [4][27] - 支持中文提示词,生成过程快速,约两分钟即可产出带配乐的视频 [22] - 可生成多种风格,包括吉卜力动漫风格、1960年代黑白新闻报道风格等 [12][28][29] - 当前普通版本存在画质较低的问题,但ChatGPT Pro用户可抢先体验更高质量的Sora 2 Pro模型 [23][31] 商业化与行业影响 - 官方计划后续发布Sora 2的API,为更广泛商用提供可能 [32] - 应用依托OpenAI现有大语言模型研发了全新类别的推荐算法,用户可通过自然语言调控信息流 [37] - 发布后与快手旗下可灵等现有AI视频应用形成直接竞争,引发效果对比 [42]
OpenAI突然发布Sora 2:好一个“AI版抖音”!
量子位·2025-10-01 09:12