AirScape
搜索文档
华为哈勃押注,成立仅半年融资三连跳,这家公司凭什么成为“世界模型黑马”?
搜狐财经· 2026-01-20 19:29
公司概况与融资 - 公司流形空间(Manifold AI)由商汤科技早期核心成员武伟博士创立,旨在通过世界模型让AI不仅能“看见”更能“推演”物理世界 [1][5] - 公司成立于2025年5月,在成立后7个月内以“倍速模式”快速完成三轮融资,累计融资额超3亿元人民币 [3][4][5] - 天使+轮融资由梅花创投、君联资本、华为哈勃联合投资,老股东英诺基金继续加注,华为哈勃的入场被视为强烈的产业信号 [1][5][6] 技术路径与核心产品 - 公司避开主流视觉-语言模型路线,独创World Model Action路径,其自研的WorldScape世界模型通过海量第一人称视角视频预训练,使AI能根据单张图片预测物体运动与物理交互 [6][7] - 公司已完成室外-室内-空域的全域具身模型布局,包括面向自动驾驶的DriveScape、物理信息可控的RoboScape以及全球首个无人机专属世界模型AirScape,这些场景模型均基于同一基座WorldScape迭代 [10] - 公司实测表明,其模型在zero-shot泛化能力上已显著超过包括pi0.5在内的经典VLA模型,相关成果即将面向社区开放 [10] 团队管理与发展战略 - 创始人武伟博士曾主导商汤“开悟”世界模型研发,团队由工业界资深人士与年轻天才组成,注重人才密度而非数量,并采用“数据驱动”和“强化学习”式的管理方法 [5] - 公司发展战略务实,概括为“攀登高峰,沿途下蛋”,即致力于打造通用具身世界模型基座,同时将RoboScape、AirScape等子领域模型提前产品化与商业化以产生营收 [13] - 公司已率先接入NVIDIA Jetson Thor用于端侧部署,华为的加入有望为未来国产化芯片与机器人大脑的集成路线铺平道路,加速规模化落地 [6] 市场愿景与行业定位 - 公司的长期目标是推动Physical AI Agent发展,并让“自研+赋能”的机器人总量超过市场的10% [11][12] - 行业认为世界模型指向了AI长期缺失的“物理直觉”或“物理常识的暗物质”,是智能体走进真实世界的关键,未来三年将看到其从实验室走向仓库、工厂和家庭 [10][13][14] - 资本市场对“物理AI”及世界模型赛道极度渴求,担心错过“下一个GPT时刻”,连续融资反映了对该技术路径的期待 [5][14]
华为哈勃押注,成立仅半年融资三连跳,这家公司凭什么成为“世界模型黑马”?
机器人大讲堂· 2026-01-20 17:11
公司概况与融资动态 - 公司流形空间(Manifold AI)由商汤科技早期核心成员武伟博士创立,致力于通过世界模型让AI从“看见”世界迈向“推演”世界 [1][7] - 公司成立仅7个月便完成超亿元天使+轮融资,投资方包括梅花创投、君联资本、华为哈勃,老股东英诺基金继续加注 [1][2] - 自2025年5月成立以来,公司融资节奏极快,先后完成种子轮、约亿元天使轮和超亿元天使+轮,不到一年累计完成超3亿元融资 [2][4][7] 技术路径与核心产品 - 公司摒弃主流视觉-语言模型路线,独创世界模型行动路径,其自研的WorldScape世界模型通过海量第一人称视角视频预训练,使AI能根据单张图片预测物体运动与物理交互 [12][13][14] - 公司已完成室外-室内-空域的全域具身模型布局,包括面向自动驾驶的DriveScape、物理信息可控的具身模型RoboScape以及全球首个无人机专属世界模型AirScape,这些场景模型均基于同一个基座模型WorldScape迭代而来 [15] - 公司实测表明,其模型在zero-shot泛化能力上已显著超过包括pi0.5在内的经典视觉-语言-行动模型 [15] 团队管理与战略愿景 - 创始人武伟曾主导商汤“开悟”世界模型研发,团队由工业界资深人士与年轻天才组成,注重人才密度而非数量,并采用数据驱动的“强化学习”式管理方法 [7][8] - 公司发展战略被概括为“攀登高峰,沿途下蛋”,即致力于打造通用的具身世界模型基座,同时将RoboScape、AirScape等细分领域模型提前产品化与商业化以产生营收 [20] - 公司的长期目标是推动Physical AI Agent发展,并让公司“自研+赋能”的机器人总量超过市场的10% [19] 产业合作与生态意义 - 华为哈勃作为战略投资者入场,其终端设备与工业数字化布局与公司技术落地方向高度契合,有望加速世界模型在端侧设备、工业机器人、智能汽车等场景的规模化落地 [9][11] - 公司技术已率先接入NVIDIA Jetson Thor用于端侧部署,华为的加入或将为未来国产化芯片与机器人大脑的集成路线铺平道路 [11] - 行业观点认为,世界模型指向AI系统长期缺失的“物理直觉”或“物理常识”,是智能体走进真实世界的关键,未来三年将看到该技术从实验室走向仓库、工厂和家庭 [14][20][22]
商道创投网·会员动态|流形空间·完成超亿元天使+轮融资
搜狐财经· 2026-01-14 00:19
公司融资与估值 - 流形空间于近日完成超亿元天使+轮融资 融资由君联资本和同创伟业领投 哈勃投资等多家机构跟投 [2] 公司背景与团队 - 流形空间成立于2025年5月 是一家专注于通用空间世界模型研发的高科技企业 [3] - 公司创始人武伟博士曾是商汤科技早期核心成员 主导过开悟世界模型的研发 [3] - 投资方君联资本认可团队的专业背景和执行力 认为其为项目未来发展提供了有力保障 [5] 核心技术产品 - 公司核心产品为WorldScape模型 该模型通过海量第一人称视角视频数据进行预训练 能够预测并模拟空间内的物理反馈 [3] - WorldScape模型旨在使机器人从旁观者变为改造者 [3] - 公司在低空经济领域取得显著进展 其AirScape子模型能让无人机在复杂场景下实现自主穿梭 [3] - 投资方认为WorldScape模型在空间智能领域具有创新性 并已展现出强大的技术壁垒 [5] 融资用途与战略规划 - 本轮融资将主要用于技术研发与产品迭代 以进一步优化WorldScape模型的性能和应用场景 [4] - 融资还将用于加大市场拓展力度 推动产品在更多行业的落地应用 以提升市场占有率 [4] 行业环境与投资逻辑 - 当前政府出台了多项政策支持人工智能与机器人技术的发展 行业从业者正推动技术从实验室走向市场 [6] - 投资方君联资本认为公司的技术实力和市场潜力是吸引投资的关键因素 其在低空经济等领域的成功应用展现了商业价值 [5] - 创投机构管理人对流形空间的技术创新高度认可 出资人期待基金管理人能够在该领域精准布局 [6] - 本轮融资被视作空间智能领域的重要事件 [6]
锦秋被投企业Manifold AI流形空间完成超亿元天使+轮融资,国产世界模型让机器人大脑超进化|Jinqiu Spotlight
锦秋集· 2026-01-10 14:13
公司融资与资金用途 - Manifold AI(流形空间)完成超亿元天使+轮融资,由君联资本领投,梅花创投、华为哈勃跟投,老股东英诺基金、锦秋基金、同创伟业持续加注 [4] - 公司在半年内累计已获得数亿元融资 [4] - 所募资金将用于世界模型的迭代和具身大脑的应用落地 [4] 核心技术:世界模型 - 公司自研通用空间世界模型WorldScape,具备单图生成可交互空间的能力 [6] - WorldScape在生成质量、时空一致性、实时性等方面全面对标国外一线世界模型,如Google Genie3、李飞飞World Labs RTFM等 [6] - 公司依托海量物理视频数据预训练,使WorldScape具备强大的通用空间操作交互能力,补齐了世界模型落地到物理AI的最后一块拼图 [8] - 公司坚持World Model Action技术路线,利用自研世界模型作为基础模型替换通用VLM模型,使机器人大脑获得“超进化” [10] 技术性能与成果 - 实测表明,其模型在落地性能上显著超过了pi0.5等经典VLA模型,zero-shot泛化能力大幅领先当前具身模型 [10] - 相关模型即将在社区发布 [10] - 公司是世界范围内首个全域布局室外、室内、空域具身世界模型后训练的团队 [9] - 相关成果DriveScape、RoboScape、AirScape已分别发表在国际顶级会议CVPR2025、NeurIPS2025、ACM MM2025上 [9] - 多个场景的后训练基于同一个世界基座模型WorldScape迭代,提升了数据闭环效率和模型性能上限 [9] 产业合作与部署 - 公司已率先接入NVIDIA Jetson Thor用于具身世界模型的本体部署 [14] - 产业投资人华为哈勃的加入,将有利于提前布局国产化芯片和机器人大脑的集成,奠定规模化落地的基础 [14]
流形空间CEO武伟:当AI开始“理解世界”,世界模型崛起并重塑智能边界|「锦秋会」分享
锦秋集· 2025-11-05 22:01
世界模型的核心概念与定义 - 世界模型是AI智能的下一个基础范式,其目标不是生成内容,而是在智能体内部模拟世界的运行规律[9] - 世界模型是一种可以模拟所有场景的生成式模型,被理解为"the online simulator in our brain",即能够在线进行模拟的智能体模型[15] - 技术上,世界模型通过隐式建模学习并近似环境的状态转移概率分布,从而在仿真空间中进行预测与推演[16] - 与传统AIGC不同,世界模型的目标不是"还原现实",而是通过预测环境变化来做出更优决策[9] 世界模型的技术价值与应用方向 - 世界模型让AI第一次具备"心智推演"能力,能在脑中模拟因果、预判后果、优化行动[9] - 主要应用方向包括构建Agent Model和环境模型两大范式[18][22] - 作为Agent Model时,通过在线模拟和推演获得更好决策,替代依赖经验回放的模仿学习方式[18] - 作为环境模型时,通过离线强化学习获得更好泛化能力,成为通用的Omni Simulator[22] - 为自动驾驶、无人机、具身智能等领域奠定通用智能底座,实现从"经验学习"到"因果理解"的跨越[9] 行业技术路线与发展历程 - 世界模型方向最早可追溯到2018年论文《World Models》,提出Mental Model概念并通过RNN对世界状态进行建模[24] - 2024年OpenAI的Sora出现后形成首个具备文生视频能力的结构化模型,AIGC技术与视觉世界模型开始深度融合[24] - Google的Genie系列基于海量视频数据进行scaling up,训练具有三维空间一致性的视频生成模型,以自回归技术路线为主干[27][28] - Google的Dreamer系列核心思想与AlphaGo一脉相承,在模型构造的虚拟环境中让智能体进行强化学习,经过三代迭代实现跨游戏环境泛化[43][44][52] - Meta的V-JEPA技术路线引入新思路,通过sampling与能量函数评估方式搜索最优执行状态,提供更可解释、更物理一致的智能体建模方式[55][56][57] 流形空间的技术布局与成果 - 公司提出"全域世界模型"体系,已在自动驾驶、机器人、无人机等方向实现突破[9] - 2025年CVPR上发表DriveScape自动驾驶世界模型,比特斯拉Autopilot自动驾驶世界模型发布更早[75] - 2025年NeurIPS上发布RoboScape,是首个针对具身智能的物理可控世界模型,能通过单帧图像+语言指令执行物理动作,支持刚体与柔性物体交互[78] - 2025年ACM MM上推出全球首个无人机世界模型AirScape,通过显式世界建模实现空间与视角统一控制[81] - 所有模型基于自研LongScape基础架构,结合Auto-regressive + DiT混合建模方式,整体研发进度超前于特斯拉世界模型团队[83] - 已将模型量化蒸馏部署到边缘端推理系统,驱动机器人实现自主移动以及无人机实现自主导航[84] 当前挑战与未来发展方向 - 现有模型如Cosmos、Genie、WorldLabs在多模态感知、指令遵循、物理世界建模等方面仍有不足,任务适应性不够强[66] - 具身智能体面临跨尺度空间挑战,自动驾驶汽车、室内操作机器人、低空无人机等不同尺度下的泛化能力仍然较弱[67] - 未来提升主要集中在五个方面:需要更丰富的多模态数据、更强的表征学习能力、新的原生世界模型基模架构、转向任务执行能力的训练目标、以及任务泛化与跨环境自适应能力[69][70][71][72][73]
清华团队提出AirScape:动作意图可控的低空世界模型,全面开源!
具身智能之心· 2025-11-05 17:00
文章核心观点 - 清华大学团队提出名为AirScape的生成式世界模型,专为六自由度(6DoF)空中具身智能体设计 [5] - 该模型能基于当前的低空视觉观测和动作意图,推演未来的序列观测,以解决具身智能领域的推演和想象基础问题 [3][6] - 项目包含一个11k视频片段的数据集,并采用两阶段训练方案,在关键指标上相比基线模型有显著提升 [7][11][18][21] 技术挑战与解决方案 - 现有世界模型研究主要聚焦于二维平面操作的人形机器人和自动驾驶,动作空间有限 [4] - 关键挑战包括缺乏第一人称视角的低空飞行数据集、视频基础模型与世界模型的分布差异、以及无人机6DoF运行带来的生成多样性与复杂性 [8] - AirScape通过构建包含11,000个视频-意图对的数据集,并采用两阶段训练方案来解决这些挑战 [7][11] 数据集特点 - 数据集涵盖工业区、住宅区、海边等多种空间场景 [9] - 包含平移、旋转和复合动作等多种动作类型,以及晴天、多云、夜晚等多种光照条件 [9] - 通过多模态大模型生成意图并经过超过1,000小时的人工校正,确保意图描述的准确性和逻辑性 [9] 模型训练方法 - 阶段一:利用11k视频-意图对数据集对视频生成基础模型进行监督微调,学习意图可控性 [11] - 阶段二:引入self-play training机制,通过时空判别器进行拒绝采样,学习时空约束 [14] - 时空判别器评估四个关键特征:意图对齐、时间连续性、动态程度和空间合理性 [14] 性能表现 - 在衡量动作对齐能力的关键指标IAR上,相对表现最佳的基线模型提升超过50% [21] - 在衡量生成视频质量的FID和FVD指标上,分别取得了15.47%和32.73%的提升 [21] - 在平移、旋转和复合动作等任务上,平均IAR达到84.51%,显著优于其他对比模型 [13] 未来发展方向 - 未来目标包括提升实时性能、轻量化设计以及在协助现实世界空中智能体操作决策方面的适用性 [19]