Workflow
Video Rebirth刘威:视频生成模型是构建世界模型的最佳路径
IPO早知道·2025-08-18 10:31

世界模型技术发展 - 视频生成模型被视为构建世界模型的最佳路径,有望成为AI从感知向认知跃迁的关键突破口 [2] - AI技术发展经历四个阶段:符号主义、连接主义、现实主义、生成主义,2025年处于关键拐点,软件向智能体过渡,硬件向物理AI演进 [2] - OpenAI的O1模型(2024年9月发布)首次实现AI真正推理能力,标志连接主义40年探索的突破 [2] 世界模型核心能力 - 世界模型需具备三大能力:模拟能力(仿真功能)、预测能力(因果推理)、探索能力(规划决策),分别对应快思考感知、慢思考认知和主动思考 [3] - 当前多模态模型(如GPT-4o)仍处于被动响应模式,缺乏环境整体建模和预测能力,世界模型需转向主动思考 [3] - SORA为世界模型提供技术启发,通过视频生成实现时空变化模拟,证明世界模型可行性 [3] Video Rebirth的技术路径 - 公司将视频原生世界模型定义为世界模拟器与预测器的组合,当前DiT架构存在因果推理缺失、无法交互干预等问题 [4] - 未来技术升级方向包括构建独有模型范式,目标实现视频生成领域的"ChatGPT moment",推出首个视频原生世界模型 [4] - 通过视频生成切入世界模型,有望在AI认知能力突破期提供技术创新,支撑通用人工智能发展 [4]