Sora 2深夜来袭,OpenAI直接推出App,视频ChatGPT时刻到了
机器之心·2025-10-01 07:49

产品发布与定位 - OpenAI 在行业其他公司专注于大模型时,悄然发布了视频生成模型 Sora2 [1] - 此次发布是直接产品化,推出了名为“Sora”的 iOS 社交应用,并配套了视频推送算法 [3] - OpenAI 将 Sora2 定位为视频领域的“GPT-3.5 时刻”,类比于 ChatGPT 带来的行业变革 [8] 技术能力与突破 - Sora2 在物理准确性、真实感和可控性方面均优于以往的视频生成系统 [5] - 模型能够呈现高难度动态场景,如奥运体操动作、精确模拟浮力和刚性动态变化 [12] - 系统能够模拟失败场景,例如篮球未投中时会从篮板反弹,而非扭曲物理定律,这在世界模拟能力上是一项重要进步 [13] - 该模型具备同步的对话和音效能力,能以高度真实感创建复杂的背景音、语音和音效 [6][15] - 引入了“上传你自己”功能,可将现实世界的人、动物或物体元素高保真地注入到生成的任何视频环境中 [16][19] - 模型在可控性方面取得重大飞跃,能够遵循复杂的多镜头指令并准确维持世界状态,擅长写实、电影和动漫风格 [14] 产品功能与体验 - 新推出的“Sora”应用允许用户创作作品、进行二次创作,并在可定制的信息流中发现新视频 [19] - 核心功能“客串(cameos)”使用户在验证身份后,能以极高逼真度融入任何 Sora 生成的场景,用户对自身形象拥有完全的使用控制权 [19][20] - 应用设计理念是最大限度地促进创作而非消费,默认信息流内容严重偏向用户关注或互动的人,以及可能激发创作灵感的视频 [22] 推荐算法与安全理念 - OpenAI 开发了一类新的可通过自然语言指令设定的推荐算法,以解决视频成瘾和内容推送优化问题 [22] - 算法内置机制会定期询问用户身心健康状况,并主动提供调整信息流的选项,公司声称并非针对用户观看时长进行优化 [22] - 公司在应用中解决了使用肖像的许可、来源出处及防止生成有害内容等多项安全问题 [22] 市场进入与可用性 - Sora iOS 应用现已在美国和加拿大可供下载,初始阶段免费并提供较为宽松的算力限制 [25] - ChatGPT Pro 用户可在 sora.com 上使用实验性的、更高质量的 Sora 2 Pro 模型 [25] - OpenAI 计划在未来通过 API 发布 Sora 2 [25] 行业影响与愿景 - 从2024年2月发布的初代 Sora(被视为视频领域的GPT-1时刻)到 Sora2,公司证明了通过扩大视频数据上的神经网络规模可更接近模拟现实 [11][17] - OpenAI 认为 Sora 将是一个比现有平台更有利于娱乐与创意发展的平台 [23]