Workflow
锦秋基金被投企业流形空间3个月融资亿元,证明世界模型也需要预训练 |Jinqiu Spotlight
锦秋集·2025-11-12 20:44

公司概况与融资动态 - 锦秋基金是一家12年期的AI Fund,以长期主义为核心投资理念,专注于投资具有突破性技术和创新商业模式的通用人工智能初创企业[5] - 锦秋基金已完成对Manifold AI(流形空间)的投资[4] - 流形空间成立3个月便连获种子轮和天使轮两轮共亿元融资,成为世界模型领域的一匹黑马[6] 世界模型技术理念与优势 - 世界模型旨在打造一个能理解并预测物理世界的大脑,其核心是找到一种既简单又通用的方案[7] - 斯坦福大学教授李飞飞提出世界模型应具备三项核心能力:生成式、多模态、交互性[7] - 世界模型与VLA模型是具身智能领域的两种不同技术路径,世界模型通过将语言升维到视觉域,模拟所有场景,具备Dreaming想象能力[18] - 世界模型作为Agent Model可通过在线模拟和推演获得更优决策,作为Environment Model可通过离线强化学习使物理智能体获得更好泛化能力[20] - 世界模型让AI首次具备心智推演能力,能在脑中模拟因果、预判后果、优化行动,理论上能以更经济方式实现跨本体、跨场景的泛化[22] 世界模型技术路径与竞争格局 - 世界模型技术脉络可归纳为两大派系:显式物理建模和隐空间交互[25] - 显式物理建模代表包括Google Genie系列和斯坦福李飞飞创办的WorldLabs,后者采用Geometry Forcing方式引入显式物理信息[26][29] - 隐空间交互代表包括Google Dreamer系列和Meta的V-JEPA系列,后者通过采样与能量函数评估方式搜索最优执行状态[30][31] - 流形空间是全球唯一布局全域世界模型的团队,其技术路径为自下而上,先做领域模型并通过场景反馈数据不断完善模型能力[33] 流形空间技术策略与创新 - 流形空间选择从预训练开始做起,让模型真正学习物理世界的先验知识,理解因果规律,以降低后期部署成本和数据需求[35][37] - 在数据方面,流形空间采用70%互联网数据和30%真机采集,更倾向于使用第一人称视角数据和带有失败状态恢复的数据[39] - 在模型架构上,流形空间提出具身基座模型需具备推理、想象、执行三位一体的能力,并创新地在视频生成质量和动作质量间建立正相关[40] - 流形空间采用Auto-regressive+DiT混合建模的LongScape架构,其领域模型能方便地用MoE方式混合成更通用的基座模型[35] 商业化战略与市场选择 - 公司发展战略总结为“攀登高峰,沿途下蛋”,即瞄准通用具身世界模型基座的同时,将领域模型提前产品化和商业化以产生营收[42] - 在落地场景上,优先考虑机器人和无人机领域,但不考虑自动驾驶,因机器人市场更加碎片化,能容纳更多玩家[43][44] - 具体聚焦于让硬件本体拥有自主推理能力,推动机器人和无人机从人类控制阶段向智能化、自主推理方向发展[46][47] - 长期来看,世界模型产品化需轻量化,公司已将模型量化蒸馏部署到边缘端推理系统,并选择英伟达芯片,未来考虑国产芯片[47] 团队管理与未来规划 - 团队由工业界资深人士和天才00后组成,注重人才密度而非数量,管理上采用数据驱动的强化学习方式激励团队[49][51] - 计划在2025年底至2026年初正式发布第一代基于WMA路线的基座模型,融资节奏与产品研发节奏匹配[51] - 长期目标是推动Physical AI Agent向前一大步,并实现自研加上赋能的机器人数量超过市场总量的10%[51]