Workflow
因果推理
icon
搜索文档
Z Tech|专访中科大02年白寅岐:让隐式世界模型学会因果,做最快最省落地的世界模型
Z Potentials· 2026-06-10 12:12
文章核心观点 - 世界模型是AI领域新的技术高地,旨在让AI像人一样理解物理世界,目前技术路线尚未收敛,处于充满机遇的“战国时代”[3][6] - 白泽科技创始人白寅岐(一位23岁的中国科学技术大学研究生)选择押注世界模型赛道并创业,其核心逻辑是让AI学习现象背后的演化规律,而非仅仅拟合现象本身[4][7] - 公司提出并致力于“溯因式世界模型”路线,其技术核心是结合“隐空间学习”、“因果推理”和“无标注视频缩放定律”,目标是“最快、最省地把世界模型落地”[7][13][24][32] 创始人背景与创业动机 - 创始人白寅岐2002年出生,中国科学技术大学人工智能专业研二在读,学术成果突出(顶会论文9篇,达到两个博士毕业要求),并曾参与华为AI for EDA及大模型推理加速项目[5][10][11][18] - 创业动机源于对技术收敛周期的判断:认为大语言模型范式已基本收敛,而世界模型尚处早期混沌期,是创业的机遇窗口[6][16] - 选择创业而非读博,是为了更快地将技术落地于产品,并利用合肥及中国科学技术大学的资源与人才优势[11][20] 公司概况与团队 - 公司于2026年在合肥成立,取名“白泽”,寓意理解世界万物规律[7][12] - 团队横跨人工智能、因果推理、多模态学习等领域,成员来自中科大、华为、腾讯、阿里、宾夕法尼亚大学等机构,累计发表论文500+篇[8] - 两位首席科学家分别为新西兰工程院院士王睿俐和国家级领军人才宋红教授[8] 技术路线:“溯因式世界模型” - 技术路线概括为“隐空间 + 因果推理 + 无标注视频 Scaling”[7][24] - 核心差异点:在借鉴JEPA隐空间建模的基础上,额外加入了“因果学习层”,旨在让模型理解世界演化的底层因果规律,而不仅仅是进行特征抽象[26][27] - 技术优势:预训练阶段使用海量无标注互联网视频,无需动作标注;最昂贵的真机数据仅在对齐阶段少量使用,从而大幅降低人工和数据成本[7][13][32] - 初步验证:在Physion++数据集上的小规模对照实验中,在JEPA V2架构上仅添加因果模块,使用8张A100训练大半天,即在三个评测指标上均超过原模型,显示出因果模块在物理规律理解上的优势[28] 对主流技术路线的看法与定位 - 认可当前主流路线(如Sora的2D视频、World Labs的3D空间、JEPA的隐空间)各有价值,但白泽选择了一条差异化的路径[26] - 公司路线最受JEPA启发,认为其隐空间建模逻辑能有效降低复杂度(预训练仅需上百张显卡),但通过加入因果学习补齐了其短板[27] - 目标是走一条“带着中国工程底色、又能在全球技术语境里立得住的独立路线”[14] 数据战略与落地规划 - 采用金字塔式数据体系:预训练使用大规模无标注视频(目前互联网第三人称视频与第一人称视频配比为8:2,计划年底调整至5:5);后训练使用少量带标注视频;下游具身应用依赖仿真与真机数据[33] - 第一人称(ego-centric)数据通过自研采集(合作工厂有近5000名一线工人可常态化采集)与利用行业开源生态结合获取[34] - 落地优先级:所有下游场景(如机器人、自动驾驶)的落地均依托基础世界模型的核心能力,以开放合作为主,不会急于重资产下场[36][37][38] - 明确不会自己做机器人本体,而是将具身智能作为核心验证场景,现阶段重心是打磨基础世界模型本身[36][37] 公司愿景与行业观点 - 长期愿景是成为世界模型领域对标DeepSeek、OpenAI的头部公司[40] - 认为世界模型当前的高热度并非泡沫,而是为未来世界打下AI基础设施的必要过程,其潜在价值巨大[39] - 希望发起“中国世界模型开放联盟”,汇聚产、学、研各方力量,共同定义赛道标准与生态[41]