特斯联全新研究成果聚焦3D场景理解,获IEEE T-PAMI收录
IPO早知道·2025-05-13 09:55
研究成果核心特点 - 提出名为Laser的高效语言引导分割框架 为3D场景理解提供轻量化 高精度的开放词汇分割方案 [2] - 推动语言模型与神经辐射场融合的实用化进程 并被权威学术期刊IEEE T-PAMI(CCF-A,IF 23.6)收录 [2] - 训练时间仅需11分钟 相比传统方法所需的158分钟大幅缩短 [2] 自动驾驶与机器人导航应用 - 适用于需要实时语义解析的空间智能场景 如实时理解周围环境的3D结构与语义信息 [2] - 低秩注意力机制能精准识别道路边缘 车道线等细粒度特征 避免模糊边界导致的误判 [2] - 可快速构建3D语义地图以支持安全导航和决策 [2] 增强现实与虚拟现实应用 - 能够将虚拟物体精准叠加到真实场景中 确保在不同视角下与真实场景标注对齐 避免视觉穿帮 [3][4] - 能够区分相似颜色物体 如黑白键盘与黑色鼠标垫 以提升虚拟物体放置的合理性 [4] - 与3D高斯渲染技术相结合 可实现实时语义AR效果 [4] 城市规划与建筑建模应用 - 支持对罕见物体如古建筑装饰 特殊标牌进行开放词汇分割 丰富数据标注覆盖范围 [5] - 无需人工标注3D数据 通过多视图图像即可生成带语义的3D模型 辅助城市规划决策 [5]