报告的核心观点 - Sora是OpenAI发布的一款文生视频AI模型,可以根据文本提示、静态图像或视频直接生成或扩展视频,视频时长可达1分钟 [1][3] - Sora具有多个亮点:1)首次提出统一各类视觉数据的patch,打通了扩散模型和大模型之间的桥梁 [5][6][7];2)在训练过程中"涌现"了许多新型的模拟功能,如3D一致性、远距离相干性和物体持久性、模拟物理世界的交互性、模拟数字世界等 [9][10] - Sora的推出给文生视频产业带来了明确的发展路径:更丰富的下游应用、更高的算力需求与安全需要 [13][14][15] - 目前Sora模型仍存在一些弱点,如无法准确模拟复杂场景的物理特性、缺乏因果关系、混淆prompt的空间细节和时间事件等,且安全性问题尚未完全解决,因此AIGC视频在中短期内将主要扮演"辅助者"的角色 [16][17][18] 报告内容总结 事件描述 - 2月16日凌晨,OpenAI发布了文生视频AI模型Sora,可以根据文本提示、静态图像或视频直接生成或扩展视频,视频时长可达1分钟 [1][3] - 目前Sora仅向数量有限的红队成员以及艺术家、制作人开放权限,尚未向公众开放 [3] Sora的亮点 1. 首次提出统一各类视觉数据的patch,打通了扩散模型和大模型之间的桥梁 [5][6][7] 2. 在训练过程中"涌现"了许多新型的模拟功能,如3D一致性、远距离相干性和物体持久性、模拟物理世界的交互性、模拟数字世界等 [9][10] 3. 与传统AI视频生成工具相比,Sora能够实现场景和物象的多视角、逻辑合理、内容连贯且稳定的高清镜头切换,在生成视频的时长上也遥遥领先 [11] Sora的影响 - 在软件领域,Sora的推出将进一步加深和拓宽OpenAI在AIGC领域的"护城河",底层算法和模型方面将由少数巨头占据主导地位,而下游第三方应用与生态将不断丰富 [13] - 在硬件领域,Sora将带来更高的算力需求,利好算力基础设施和AI PC等端侧硬件 [14][15] - 但目前Sora模型仍存在一些弱点,如无法准确模拟复杂场景的物理特性、缺乏因果关系等,且安全性问题尚未完全解决,因此AIGC视频在中短期内将主要扮演"辅助者"的角色 [16][17][18] 风险提示 1. 宏观经济恢复不及预期,下游行业需求不及预期 [18] 2. 贸易摩擦加剧,供应链进一步受限 [18] 3. 技术研发和迭代、产品推进不及预期,存在国产替代不及预期的风险 [18] 4. 行业竞争加剧,使得部分企业盈利能力下滑 [18]
电子行业点评:Sora模型横空出世,AIGC行业又一里程碑
五矿证券·2024-02-20 00:00