Video Rebirth刘威：视频生成模型是构建世界模型的最佳路径

世界模型技术发展 - 视频生成模型被视为构建世界模型的最佳路径，有望成为AI从感知向认知跃迁的关键突破口 [2] - AI技术发展经历四个阶段：符号主义、连接主义、现实主义、生成主义，2025年处于关键拐点，软件向智能体过渡，硬件向物理AI演进 [2] - OpenAI的O1模型（2024年9月发布）首次实现AI真正推理能力，标志连接主义40年探索的突破 [2] 世界模型核心能力 - 世界模型需具备三大能力：模拟能力（仿真功能）、预测能力（因果推理）、探索能力（规划决策），分别对应快思考感知、慢思考认知和主动思考 [3] - 当前多模态模型（如GPT-4o）仍处于被动响应模式，缺乏环境整体建模和预测能力，世界模型需转向主动思考 [3] - SORA为世界模型提供技术启发，通过视频生成实现时空变化模拟，证明世界模型可行性 [3] Video Rebirth的技术路径 - 公司将视频原生世界模型定义为世界模拟器与预测器的组合，当前DiT架构存在因果推理缺失、无法交互干预等问题 [4] - 未来技术升级方向包括构建独有模型范式，目标实现视频生成领域的"ChatGPT moment"，推出首个视频原生世界模型 [4] - 通过视频生成切入世界模型，有望在AI认知能力突破期提供技术创新，支撑通用人工智能发展 [4]