WorldScape
搜索文档
锦秋基金被投Manifold AI发布通用交互世界模型,让智能体具备实时未来预测能力|Jinqiu Spotlight
锦秋集· 2026-02-26 11:31
公司及产品介绍 - 锦秋基金于2025年领投了Manifold AI(流形空间)的天使轮,并在天使+轮继续追加投资,该基金是一家12年期的AI Fund,以长期主义为核心投资理念,积极寻找具有突破性技术和创新商业模式的通用人工智能初创企业 [4] - Manifold AI(流形空间)基于自研的世界模型构建具有通用理解和交互能力的具身智能体 [2] - 公司近日发布了名为WorldScape的通用交互世界模型,该模型成为当前主流世界模型评测worldscore榜单排名第一的实时世界模型 [5][9][40] WorldScape模型核心优势 - WorldScape是目前少数能够在四个核心维度上同时取得领先表现的交互式世界模型 [11] - 优势一:提供全面领先的交互体验,通过统一的动作—世界状态建模框架,同时支持空间导航与物体操作,避免了多模块拼接带来的不一致问题 [11] - 优势二:具有更稳定、可信的三维世界结构,在训练过程中显式引入三维几何感知的空间表示与约束,有效缓解了长时生成中常见的几何漂移与结构崩塌问题 [12] - 优势三:在实时生成下保持高视觉质量,通过结构化生成与高效训练策略,在单张GPU上实现接近实时(6–16 FPS)的交互式生成,并在成像质量、运动平滑度等视觉指标上位居前列 [13] - 优势四:具备“记忆”的世界,通过几何感知的世界状态记忆机制,使模型能够在不同时间步之间共享和更新信息,这是区分“视频生成模型”和“世界模型”的关键 [14] 核心技术:时空一致性 - WorldScape层次化地从训练和推理设计入手,增强生成内容在时间和空间上的一致性 [16] - 采用多任务学习范式,将三维几何先验深度融合进模型的“认知”,构建几何约束的生成框架 [19] - 训练过程同时受流匹配损失与三维几何信号(深度和3D高斯泼溅)的互补监督,通过联合优化总体损失函数对生成内容的场景结构与空间关系形成强约束 [20] - 通过端到端的3D重建支路任务,强制模型在生成每一帧时都遵循严谨的空间物理逻辑,从而大幅减小空间拓扑结构的畸变 [21] 核心技术:高效长序列一致性建模 - 针对长视频生成中显存爆炸与长期一致性难以兼顾的痛点,提出了一种基于KV缓存的优化策略 [24] - 该策略利用相机轨迹先验,通过三级分层架构(永久锚点、全局记忆池、局部滑动窗口)实现子线性的显存复杂度 [24] - 结合相机外参矩阵,通过几何相似度评分,优先提取与当前视角最相关的场景记忆,确保模型在移动拍摄时能精准“回想起”之前出现过的物体 [25] - 通过门控去重与全局剪枝,实时评估新信息的“惊喜度”,主动保留难以被现有记忆重建的视觉特征,剔除冗余信息,在有限的显存预算下扩展场景容量 [26] 核心技术:通用交互控制 - WorldScape提出统一交互感知条件建模机制,解决了现有模型往往只支持单一控制模式(如只支持移动、语言或操控某类物体)的问题 [29] - 支持摄像机轨迹控制,采用Plücker embedding表示摄像机轨迹,将每一帧的相机参数编码为结构化空间表示,然后通过轻量Adapter注入到扩散Transformer中,使模型能精确建模WASD移动、QERF旋转、任意视角轨迹等条件信号 [30] - 支持手部动作控制,将手部动作转换为姿态视频,与初始帧拼接后输入模型,实现接触、抓取、操控等操作,在一个世界模型中统一了导航与操作 [31] 核心技术:实时交互 - WorldScape采用基于Self Forcing的非对称蒸馏架构实现实时交互 [34] - 先训练一个完整统一交互可控的双向注意力扩散模型,再应用分布匹配蒸馏,蒸馏成按逐个视频chunk进行生成的因果自回归扩散模型 [34] - 通过基于滑动窗口的自回归去噪来减弱Self Forcing的严格因果性,允许不同chunk在去噪过程中相互关注,从而使不同chunk衔接处的相机运动更加平滑 [34] - 模型可在单张GPU上实时生成832×480分辨率视频 [9] 能力评估与行业地位 - 在WorldScore基准的官方排行榜中,WorldScape是综合排名第一的实时模型 [40] - 实验结果表明,WorldScape在视觉质量、交互响应、三维空间一致性、长期记忆能力以及单卡实时生成像素吞吐率等多个关键维度上实现均衡领先 [40] - 具体指标显示:WorldScape在成像质量上得分为0.685,运动平滑度为0.986,主体质量为0.891,背景一致性为0.923,轨迹准确性为0.717,记忆对称性为0.686 [38] - 这一结果表明,模型规模并非获得高水平世界生成能力的唯一决定因素,通过合理的时空建模与控制机制设计,实时模型同样可以在复杂多场景设定下取得强竞争力 [40] 总结与展望 - WorldScape模型突破了已有工作在通用性、实时性等方面的不足,通过空间一致性增强的自回归蒸馏框架,兼容不同类型的动作注入模块 [42] - 该模型在保证高交互效率的同时,维持稳定的动作跟随能力,有望成为支撑通用具身智能体的空间智能基座 [42] - 世界模型的愿景是为智能体打造一个无限且真实的“虚拟实验室”,通过在内部模拟环境的演化,使智能体可以在虚拟世界中进行无限制的探索、学习与决策,而无需昂贵的真实世界试错 [7]
华为哈勃押注,成立仅半年融资三连跳,这家公司凭什么成为“世界模型黑马”?
机器人大讲堂· 2026-01-20 17:11
公司概况与融资动态 - 公司流形空间(Manifold AI)由商汤科技早期核心成员武伟博士创立,致力于通过世界模型让AI从“看见”世界迈向“推演”世界 [1][7] - 公司成立仅7个月便完成超亿元天使+轮融资,投资方包括梅花创投、君联资本、华为哈勃,老股东英诺基金继续加注 [1][2] - 自2025年5月成立以来,公司融资节奏极快,先后完成种子轮、约亿元天使轮和超亿元天使+轮,不到一年累计完成超3亿元融资 [2][4][7] 技术路径与核心产品 - 公司摒弃主流视觉-语言模型路线,独创世界模型行动路径,其自研的WorldScape世界模型通过海量第一人称视角视频预训练,使AI能根据单张图片预测物体运动与物理交互 [12][13][14] - 公司已完成室外-室内-空域的全域具身模型布局,包括面向自动驾驶的DriveScape、物理信息可控的具身模型RoboScape以及全球首个无人机专属世界模型AirScape,这些场景模型均基于同一个基座模型WorldScape迭代而来 [15] - 公司实测表明,其模型在zero-shot泛化能力上已显著超过包括pi0.5在内的经典视觉-语言-行动模型 [15] 团队管理与战略愿景 - 创始人武伟曾主导商汤“开悟”世界模型研发,团队由工业界资深人士与年轻天才组成,注重人才密度而非数量,并采用数据驱动的“强化学习”式管理方法 [7][8] - 公司发展战略被概括为“攀登高峰,沿途下蛋”,即致力于打造通用的具身世界模型基座,同时将RoboScape、AirScape等细分领域模型提前产品化与商业化以产生营收 [20] - 公司的长期目标是推动Physical AI Agent发展,并让公司“自研+赋能”的机器人总量超过市场的10% [19] 产业合作与生态意义 - 华为哈勃作为战略投资者入场,其终端设备与工业数字化布局与公司技术落地方向高度契合,有望加速世界模型在端侧设备、工业机器人、智能汽车等场景的规模化落地 [9][11] - 公司技术已率先接入NVIDIA Jetson Thor用于端侧部署,华为的加入或将为未来国产化芯片与机器人大脑的集成路线铺平道路 [11] - 行业观点认为,世界模型指向AI系统长期缺失的“物理直觉”或“物理常识”,是智能体走进真实世界的关键,未来三年将看到该技术从实验室走向仓库、工厂和家庭 [14][20][22]
商道创投网·会员动态|流形空间·完成超亿元天使+轮融资
搜狐财经· 2026-01-14 00:19
公司融资与估值 - 流形空间于近日完成超亿元天使+轮融资 融资由君联资本和同创伟业领投 哈勃投资等多家机构跟投 [2] 公司背景与团队 - 流形空间成立于2025年5月 是一家专注于通用空间世界模型研发的高科技企业 [3] - 公司创始人武伟博士曾是商汤科技早期核心成员 主导过开悟世界模型的研发 [3] - 投资方君联资本认可团队的专业背景和执行力 认为其为项目未来发展提供了有力保障 [5] 核心技术产品 - 公司核心产品为WorldScape模型 该模型通过海量第一人称视角视频数据进行预训练 能够预测并模拟空间内的物理反馈 [3] - WorldScape模型旨在使机器人从旁观者变为改造者 [3] - 公司在低空经济领域取得显著进展 其AirScape子模型能让无人机在复杂场景下实现自主穿梭 [3] - 投资方认为WorldScape模型在空间智能领域具有创新性 并已展现出强大的技术壁垒 [5] 融资用途与战略规划 - 本轮融资将主要用于技术研发与产品迭代 以进一步优化WorldScape模型的性能和应用场景 [4] - 融资还将用于加大市场拓展力度 推动产品在更多行业的落地应用 以提升市场占有率 [4] 行业环境与投资逻辑 - 当前政府出台了多项政策支持人工智能与机器人技术的发展 行业从业者正推动技术从实验室走向市场 [6] - 投资方君联资本认为公司的技术实力和市场潜力是吸引投资的关键因素 其在低空经济等领域的成功应用展现了商业价值 [5] - 创投机构管理人对流形空间的技术创新高度认可 出资人期待基金管理人能够在该领域精准布局 [6] - 本轮融资被视作空间智能领域的重要事件 [6]
锦秋被投企业Manifold AI流形空间完成超亿元天使+轮融资,国产世界模型让机器人大脑超进化|Jinqiu Spotlight
锦秋集· 2026-01-10 14:13
公司融资与资金用途 - Manifold AI(流形空间)完成超亿元天使+轮融资,由君联资本领投,梅花创投、华为哈勃跟投,老股东英诺基金、锦秋基金、同创伟业持续加注 [4] - 公司在半年内累计已获得数亿元融资 [4] - 所募资金将用于世界模型的迭代和具身大脑的应用落地 [4] 核心技术:世界模型 - 公司自研通用空间世界模型WorldScape,具备单图生成可交互空间的能力 [6] - WorldScape在生成质量、时空一致性、实时性等方面全面对标国外一线世界模型,如Google Genie3、李飞飞World Labs RTFM等 [6] - 公司依托海量物理视频数据预训练,使WorldScape具备强大的通用空间操作交互能力,补齐了世界模型落地到物理AI的最后一块拼图 [8] - 公司坚持World Model Action技术路线,利用自研世界模型作为基础模型替换通用VLM模型,使机器人大脑获得“超进化” [10] 技术性能与成果 - 实测表明,其模型在落地性能上显著超过了pi0.5等经典VLA模型,zero-shot泛化能力大幅领先当前具身模型 [10] - 相关模型即将在社区发布 [10] - 公司是世界范围内首个全域布局室外、室内、空域具身世界模型后训练的团队 [9] - 相关成果DriveScape、RoboScape、AirScape已分别发表在国际顶级会议CVPR2025、NeurIPS2025、ACM MM2025上 [9] - 多个场景的后训练基于同一个世界基座模型WorldScape迭代,提升了数据闭环效率和模型性能上限 [9] 产业合作与部署 - 公司已率先接入NVIDIA Jetson Thor用于具身世界模型的本体部署 [14] - 产业投资人华为哈勃的加入,将有利于提前布局国产化芯片和机器人大脑的集成,奠定规模化落地的基础 [14]