在线增量重建
搜索文档
TALO: 支持任意3D基础模型、任意相机配置的室外重建系统
自动驾驶之心· 2026-01-08 17:07
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文作者 | Fengyi Zhang等 编辑 | 自动驾驶之心 3D视觉基础模型:从离线重建到在线增量重建 最近, 3D视觉基础模型 的出现,如 VGGT、π³、MapAnything,标志着三维重建领域迈入了一种端到端、数据驱动的新范式。这类模型能够在一次前向推理中,直 接从输入图像预测相机内参、相机位姿以及稠密几何结构,极大地简化了传统三维重建流程,并展现出强大的跨场景泛化能力。基础模型的成功建立在大规模、有 标注的3D数据集以及在其上训练的大型 Transformer 架构,这使得模型能够同时学习多视几何、视角关系以及场景结构先验。 然而,现有的大多数基础模型主要被设计用于 离线场景重建 ,即在推理阶段可以 一次性访问完整的图像序列 。而在自动驾驶、机器人操作等现实应用场景中,系 统通常需要具备 在线重建能力 :模型应当能够随着新数据的到来, 增量式地重建新区域 ,而非在获取全部图像后再统一处理。尽管已有少数工作如 CUT3R 尝试 在模型层面直接支 ...