Workflow
世界模拟
icon
搜索文档
对谈 Sora 核心团队:Sora 其实是一个社交产品,视频生成模型会带来科研突破
海外独角兽· 2025-11-09 16:17
Sora的产品定位与核心功能 - Sora被定位为社交产品而非单纯的视频生成工具其病毒式传播的核心是Cameos功能该功能允许用户将自己的形象融入AI生成视频中[2] - 产品设计将人类创造力置于核心位置鼓励主动创作而非被动消费信息流推荐算法围绕社交关系链展开这与传统短视频工具存在显著差异[2] - 将Sora作为独立应用推出一方面是基于此前图片生成产品ImageGen的成功经验另一方面是为了避免与ChatGPT的生产力工具定位产生冲突[2][3] - Cameos功能起初是内部工程师的随意尝试通过收集团队成员视频进行人物标记后意外发现其强大吸引力并成为产品的核心亮点[5] - Storyboard功能是Sora 2的革命性突破能够将自然语言脚本自动转化为长达25秒的连贯视频片段实现了质量标准的大幅飞跃[6] 产品开发历程与设计理念 - 产品灵感源于早期在ChatGPT内部测试的社交媒体流功能用户上传图片后其他人提出修改需求形成的动态创意交互揭示了GenAI独有的创作方式[4] - 推荐系统经过重新设计旨在服务于创意表达而非刺激被动消费避免产品陷入单纯的内容刷屏模式[8] - 产品设计基于核心假设即与朋友一起使用会更有趣推荐系统强化了社交互动未来将深化社区功能并强化私信等互动方式[12] - 团队认为产品的关键在于用户对内容的“认可印章”即有人审视后决定发布的行为本身构成了创作参与这与纯AI生成内容有根本差异[9][10] - 产品致力于创作民主化通过提供从基础混搭到专业分镜剪辑的工具降低创意门槛支持用户从初学者成长为专业创作者[10][11] 商业化策略与生态构建 - Sora 2的API成本相比Sora 1大幅降低Sora 1生成720p短视频成本约为50美元而Sora 2的定价仅为前者的九牛一毛[16] - 商业化初期采用用户日均使用30次后开始收费的模式目前未出现强烈抵制未来计划为创作者和版权方提供变现途径构建受益生态系统[16][17] - 货币化功能将优先支持早期投入资源的创作者并为版权方提供新的内容变现方式目前正启动试点项目探索新模式[14][15] - 品牌营销模式可能被重构例如创作者可将视频中的元素展示权拍卖给品牌方这代表全新的创意广告领域[18] - Cameos功能创造了独特的传播属性工程与产品负责人Thomas Dimson的个人Cameos已有17000次出镜其视频总观看量惊人展示了平台的影响力[19] 技术发展路径与行业展望 - 视频生成模型的下一个突破点是生成长达数小时的内容并基于模拟能力在科研领域创造价值长期目标是成为“世界模拟器”[2][30] - 从DALL·E 1到Sora 2技术进展显著Sora 1被视为视频领域的“GPT-1时刻”能够生成高分辨率60秒视频而Sora 2在智能和实用性上实现飞跃[29][30] - 视频模型有望推动机器人技术等领域的进展通过理解运动机制和物理规律解决传统依赖大规模现实数据采集的难题[31] - 行业里程碑将是视频模型通过模拟现象实现首个科学突破尤其是在经典物理相关领域预计2028年前可能实现这一目标[32] - 模型通过预测任务学习物理原理例如扩散模型通过去噪过程神经网络在优化压力下从海量数据中涌现出对物理规律的理解[35] 团队认知与竞争格局 - 团队规模精简约40人其中研究员9-10人产品团队不到20人系统团队约13人通过Sora API支持外部开发者构建新应用[26][27] - 行业竞争加剧但公司有信心保持领先优势核心是拥抱用户将创作工具交到用户手中而非单纯技术竞争[25] - 团队认知发生转变意识到纯AI生成内容可能空洞真正价值在于人类创作的碎片和情感共鸣而非仅追求内容质量[26] - 技术普及速度被高估基础研究领先但打造好用的产品和进行用户教育存在滞后企业端应用还需面对监管等复杂障碍[25] - 模型评估体系因实际产品落地而得到加强例如通过对比Sora 1和Sora 2对相同提示词的输出来衡量进步Cameos功能成为核心测试场景[33]