Workflow
三维重建
icon
搜索文档
世界机器人大会引爆3D视觉革命,空间智能成焦点​~
自动驾驶之心· 2025-08-11 13:45
三维重建技术进化,激光扫描仪开启机器人"全地形时代" 2025世界机器人大会(WRC)正在北京如火如荼地进行,三维感知技术成为全场核心亮点!深圳留形科技首发 全球首款千元级空间记忆模组MindPalace Odin1,观众站定数秒即可生成实时三维点云模型,融合多模态传感器 与自研MindSLAM算法,精准还原人体姿态与复杂环境结构。帕西尼推出的第三代多维触觉传感器矩阵PX-6AX- GEN3,以每秒百万次采样频率输出15维力觉数据,让机器人"触觉"细腻如人类指尖。而奥比中光发布的Pulsar ME450 3D激光雷达与Gemini 345Lg双目相机,更以超宽温域、抗干扰性能,为户外机器人装上"穿透迷雾的眼 睛"。这些技术共同指向一个趋势:三维重建正从实验室走向千行百业,成为机器人感知世界的"新基建"。 三维重建技术的终极目标,是让机器人在任意场景中"看得懂、走得通、搞得定"。最新手持激光扫描仪如D- H100,已实现120米超远距厘米级精度扫描,搭载LiDAR SLAM与双频GNSS天线,无需标记点即可在矿山、密 林、地下隧道等复杂环境中实时输出高精度点云。这类设备轻至1.83kg,开机即扫、边走边建,效率 ...
自动驾驶之心项目与论文辅导来了~
自动驾驶之心· 2025-08-07 20:00
自动驾驶之心项目与论文辅导 - 项目正式推出自动驾驶领域论文辅导服务 旨在解决学生在研究过程中遇到的环境配置 创新点实现 模型调试等疑难问题 [1] - 过往辅导成果显著 部分学员成功在CVPR ICRA等顶级会议发表论文 [1] - 2024年计划扩大辅导规模 目标助力更多学员冲击顶会 [1] 主要辅导方向 方向1:多模态与计算机视觉 - 覆盖端到端自动驾驶 BEV感知 大模型等前沿技术领域 [2][3] - 辅导老师为华为天才少年计划入选者 在CVPR/ICCV/ECCV/NIPS等顶会发表论文30+篇 总引用量超6000次 [3] - 学术指导经验丰富 曾指导博士生在CCF-A类顶会顶刊以一作/共一身份发表7篇论文 [3] 方向2:3D视觉技术 - 聚焦图像/点云数据的3D目标检测 语义分割 占据预测等多任务研究 [4][5] - 辅导老师来自国内TOP2高校 在ECCV CVPR等会议有多次论文发表记录 [5] 方向3:自动驾驶感知架构 - 研究领域包含OCC 世界模型 BEV等自动驾驶核心感知方案 [6] - 辅导团队参与多个主流感知方案开发 成员均来自国内TOP2高校 在CVPR ECCV等会议有论文发表 [6] 方向4:神经渲染与重建 - 涉及NeRF 3D Gaussian Splatting等三维重建技术 [7] - 辅导老师以第一作者发表4篇CCF-A类论文(含2篇CVPR和2篇IEEE Trans) [7] - 另有导师在CVPR ICCV ICML TPAMI等期刊会议发表多篇论文 学术背景覆盖国内外顶尖高校(QS200/国内TOP100) [7] 合作方式 - 提供个性化论文辅导服务 具体细节需通过指定微信号(wenyirumo)咨询 [7] - 咨询时需备注"论文辅导"以获取定向服务 [8]
再见伪影!港大开源GS-SDF:SDF做高斯初始化还能这么稳~
自动驾驶之心· 2025-07-24 14:46
技术方案 - 提出统一的激光雷达-视觉系统,结合三维高斯喷溅(3DGS)与神经有符号距离场(NSDF),实现几何一致的真实感渲染与高精度表面重建 [5][6] - 通过NSDF提供的流形几何场进行高斯原语初始化,提升训练收敛性并减少悬浮伪影 [22][23] - 设计双向监督的形状正则化方法,在NSDF与高斯喷溅之间建立几何约束,优化渲染与重建效果 [6][28][33] 核心创新点 - 基于物理的高斯初始化策略,利用NSDF提取表面网格顶点作为初始位置,并通过SDF值定义不透明度 [23][24] - 针对背景渲染的"天空初始化"方案,在大球面上均匀布置高斯以避免前景伪影 [25] - 结合渲染法线一致性损失与SDF表面采样点约束的双重几何正则化框架 [30][33] 性能表现 - 在Replica数据集上平均表面重建精度达0.506cm(C-L1指标),优于M2Mapping的0.499cm [46] - 外推渲染SSIM达0.955,显著高于3DGS(0.914)和InstantNGP(0.944) [46] - FAST-LIVO2数据集测试中,平均PSNR达26.988,较基准方法提升1.5dB以上 [49] 应用场景 - 适用于机器人导航、数字孪生等需要实时高质量三维重建的领域 [1] - 支持低成本激光雷达与相机组合的硬件方案,降低部署门槛 [5][48] - 在稀疏观测条件下仍能保持几何一致性,适应复杂环境 [3][6] 实现细节 - 采用哈希编码+MLP构建可扩展的NSDF网络,通过Eikonal正则化保证梯度稳定性 [16][20] - 渲染阶段使用alpha混合的光栅化方法,结合L1+DSSIM损失优化颜色输出 [13][14] - 高斯属性参数化包含位置、切向量、缩放因子、不透明度及球谐函数编码颜色 [10][11]
放榜了!ICCV 2025最新汇总(自驾/具身/3D视觉/LLM/CV等)
自动驾驶之心· 2025-06-28 21:34
自动驾驶技术研究 - DriveArena: 可控生成式自动驾驶仿真平台 支持自定义场景生成和闭环测试 [4] - Epona: 基于自回归扩散世界模型的自动驾驶系统 可预测复杂交通场景演变 [4] - SynthDrive: 高保真传感器仿真流水线 实现真实-仿真-真实数据闭环 [4] - StableDepth: 场景一致的单目深度估计模型 支持尺度不变性深度预测 [4] - U-ViLAR: 基于可微分关联的视觉定位系统 集成不确定性感知模块 [4] 3D重建与场景生成 - DiST-4D: 解耦时空扩散模型 结合度量深度生成4D驾驶场景 [4] - GaussianProperty: 通过LMMs整合物理属性的3D高斯模型 支持材质属性编辑 [4] - GS-Occ3D: 基于高斯泼墨的纯视觉占用重建框架 实现自动驾驶场景三维重构 [5] - Curve-Aware Gaussian Splatting: 参数化曲线重建技术 提升3D几何结构精度 [6] 多模态感知与决策 - CoopTrack: 端到端协同序列感知框架 优化多智能体协作效率 [4] - ETA: 基于大模型的双轨自动驾驶系统 通过前瞻性思维提升决策效率 [5] - CARP: 粗到细的视觉运动策略学习 实现分层动作预测 [5] - Detect Anything 3D: 开放词汇3D检测系统 支持野外场景任意物体识别 [5] 生成式模型应用 - TaxaDiffusion: 渐进式训练扩散模型 实现细粒度生物物种生成 [8] - Hi3DGen: 图像到3D几何生成框架 通过法向桥接保持高保真度 [5] - Aether: 几何感知的统一世界建模 集成物理规律与语义理解 [4] 机器人操作与导航 - A0: 分层 affordance 感知模型 支持通用机器人操作任务 [4] - MoMa-Kitchen: 超10万样本的移动操作基准 针对最后米导航场景 [4] - OVA-Fields: 弱监督开放词汇 affordance 场 用于机器人部件检测 [5] 视觉基础模型 - ReME: 无训练开放词汇分割框架 基于数据中心的约束解除技术 [5] - StruMamba3D: 自监督点云表征学习 探索结构Mamba架构优势 [5] - G2D: 梯度引导的多模态蒸馏 提升跨模态学习效果 [9]
新疆兵团八师:科技创新引领“戈壁明珠”新飞跃
中国新闻网· 2025-06-03 12:12
城市创新资源 - 石河子市拥有国家级经济技术开发区、国家高新技术产业开发区、国家农业科技园区三大发展引擎 [1] - 汇聚18所科研机构包括新疆农垦科学院、石河子农业科学研究院 [1] - 拥有12个国家级"双创"平台、31个省级以上重点实验室和技术创新中心 [1] - 成立石河子科技成果转移转化中心和北疆兵团区域科技创新联盟 [1] 科技创新成果 - 高新技术企业113家、科技型中小企业174家 [2] - 获国家科学技术进步奖二等奖6项、省级科学技术进步奖100余项 [2] - 天山铝业电解铝年产量突破百万吨 [2] - 众金电极箔创新成果推广至数十家企业创造综合效益数十亿元 [2] 绿色能源与农业科技 - 中新建电力集团光伏项目年提供绿色电力1.5亿千瓦时减少碳排放7.8万吨 [2] - 天业集团智能打顶机器人融合三维重建和AI技术 [3] - 自主研发"暗管排水控盐"技术解决盐碱地种植难题 [3] - 节水灌溉技术和大数据平台提升农业生产效率 [3] 政策支持与产业集群 - 出台"科技创新十条"对科技成果转化项目最高奖励500万元 [3] - 设立10亿元产业基金支持龙头企业发展 [3] - 经开区修订政策加大人才引育力度设立"人才发展专项资金" [3] - 以六大产业集群为基石推动高质量发展 [3]