DiT架构
搜索文档
Sora终究还是“死”了
虎嗅APP· 2026-03-25 17:57
Sora产品停服与市场表现 - 2026年3月24日,OpenAI视频产品Sora正式停服 [5] - 产品发布初期用户数据亮眼,2024年12月App下载量达1000万次,2025年10月Sora2发布时网站月访问量冲高至6619万 [9][10] - 但用户数据随后急剧下滑,2026年2月月访问量跌至2117万,较峰值下跌68% [12] - 商业化表现远逊于竞争对手,2025年Sora月收入仅为36.7万美元,而同期Kling AI月收入高达2000万美元 [12] 技术评估与战略失误 - 技术本身是重大突破,其DiT架构让视频生成模型首次自发理解物理规律,是一项会被写入教科书的科学成就 [16] - 核心问题在于商业战略失误,将一项前沿研究过早推向消费市场,并错误定价为20美元月费,难以覆盖高昂的算力成本 [20] - 战略失误根源在于误判了基础设施发展规律,算力成本不会像网络带宽那样因基础设施升级而快速下降,等待算力便宜并非可行战略 [22] - OpenAI的孵化逻辑“闪电扩张”不适用于受物理定律(算力成本)严格限制的产品 [22] 关键合作与行业阻力 - 2025年上半年,迪士尼与OpenAI签署了价值高达10亿美元的协议,授权Sora使用其200个经典IP [24] - 但该合作可能被误读,迪士尼的逻辑更可能是为媒介变革“占位”,而非坚信Sora会成功 [25] - 合作面临好莱坞工会(WGA和SAG-AFTRA)因AI工具戒备而产生的强烈抵制,触及合同条款层面的冲突 [26] - 同时,迪士尼自身正忙于重组亏损的流媒体业务Disney+,一笔10亿美元的AI实验在此时难以向股东交代 [26] - 最终合作被悄然搁置,随着Sora关停,10亿美元协议作废 [27] 竞争对手的成功模式 - 中国的Kling AI采取了不同的成功路径,不追求极致画质与物理真实感,而是注重生成速度快、价格低、Bug少、商业授权清晰,实现了2000万美元的年度经常性收入,是Sora全年收入的五倍有余 [29][30] - 字节跳动的Seedance(视频生成功能)直接嵌入其拥有数亿全球用户的视频编辑应用“剪映”中,解决了用户获取和分发的核心难题,这是Sora无法复制的优势 [31] - 竞争对手的成功并非因为技术更优,而是商业模式更具可持续性,Higgsfield、Runway的C端版本也面临与Sora相似的困境 [31] OpenAI内部决策与团队变动 - 2025年12月,OpenAI内部发出名为“Code Red”的备忘录,指出其消费者产品增长停滞,算力成本正在吞噬利润,需要全面收缩 [33] - Sora因算力消耗最高、变现能力最差、内容监管麻烦最多,从战略资产变为负资产,成为首要关停对象 [34][37] - 核心研发团队流失,2026年1月,Sora的两位核心研究员Tim Brooks和Bill Peebles宣布离职并加入Google DeepMind [38] 技术遗产与行业启示 - Sora的DiT架构作为重要的技术遗产将继续存在,会被学术论文引用并被其他公司产品采用 [41] - 其核心研究方向“物理感知视频生成”不会终止,相关人才将在新平台继续推进 [41] - 该案例表明,“世界模拟器”是一个融资叙事概念,但真实世界的物理定律和商业逻辑不接受路演 [42]
【招银研究|行业深度】AI应用之传媒——从PGC、UGC到AIGC ,内容产业如何变革?
招商银行研究· 2025-07-24 17:10
AIGC视频技术发展现状 - 2024年2月OpenAI发布的Sora成为视频生成领域的标志性突破,采用DiT(扩散模型+Transformer)架构,支持60秒视频生成,远超此前主流模型4秒的限制[1][8] - DiT架构兼具扩散模型的高质量生成能力和Transformer的长序列处理优势,成为当前AIGC视频模型的主流选择,但在复杂运动模拟和物理规律还原上仍需优化[1][19][21] - 国内外大厂加速布局:海外以OpenAI、Runway、Meta为代表,国内快手(可灵AI)、阿里(通义万相)、字节(即梦AI)等相继推出同类产品[5][8] 技术架构与产品性能 - 当前C端应用生成效果仍存在肢体扭曲、运动不连贯等问题,需通过"文本扩写-文生图-图生视频"多步骤提升可控性[9][26] - B端应用已实现商业化落地,如新华社每周生产150-200条AIGC新闻视频,总浏览量破5亿次;《潜入梦海》AI短片以万元成本实现传统百万元级特效效果[12][13] - 主流产品性能差异显著:Sora在物理模拟和动态一致性上领先,Meta Movie Gen采用Llama架构,阿里EasyAnimate开源模型支持5分钟长视频生成[8][25][30] 产业变革与商业化路径 - AIGC推动内容生产从人力密集型转向AI主导模式,影视制作全流程(剧本生成、分镜设计、虚拟拍摄等)效率提升90%以上,成本降至传统1%[2][48][51] - 产业价值链重构:竞争核心从制作/渠道能力转向IP创意运营和AI模型能力,头部公司通过"云+大模型+数据+应用"全生态布局争夺话语权[2][54] - 商业化进程分层:C端以低门槛工具快速获客(快手可灵AI用户达2200万),B端通过专业级应用降本增效(影视特效成本降低80%+)[57][58] 未来发展趋势 - 技术迭代方向聚焦空间分层、运动模块优化和视频预训练,需解决体操/杂技等复杂动作的"图灵时刻"难题[21][22] - 全球影视市场超3000亿美元规模(中国占300-400亿)将成AIGC视频确定性应用场景,预计2025年后进入小时级精品内容生成阶段[15][59] - 参照互联网对传媒的变革逻辑,AIGC将引发更强马太效应,字节/腾讯等平台凭借算法和数据优势加速垄断内容分发渠道[41][44][47]