ParkGaussian
搜索文档
摸底GS重建在自动驾驶业内的岗位需求
自动驾驶之心· 2026-01-24 10:55
行业需求与岗位分析 - 有企业在2026年需要在重建方向投入招聘名额(HC) [2] - 重建技术主要用于自动驾驶测试的闭环仿真 具体流程是对离线片段(clip)数据用3D高斯泼溅(3DGS)重建动静态元素 以验证新模型能否预测合理新轨迹并正常行驶 [2] - 支撑闭环仿真中重建优化一般需要5至20人的算法团队 [3] - 云端数据生产也存在需求 例如BEV视角下的静态路面重建(2DGS)可应用于静态真值生产 [3] - 小米的ParkGaussian将GS技术应用到泊车场景中 [3] - 每个技术方向至少需要10人左右的算法团队规模来支撑最基本功能需求 [3] 技术发展路线与学习资源 - 3D高斯泼溅(3DGS)领域较新 缺乏有效学习资料 对初学者存在困难 [3] - 梳理出的明确技术发展路线为:静态重建3DGS → 动态重建4DGS → 表面重建2DGS → 场景重建混合GS → 前馈GS [3] - 为应对学习需求 推出了《3DGS理论与算法实战教程》 花费两个月时间设计了一套从原理到实战的学习路线图 [3] 课程内容与结构 - 课程第一章讲解3DGS背景知识 包括计算机图形学基础、三维空间表达、渲染管线、光线追踪、辐射场渲染 并介绍SuperSplat、COLMAP、Gsplat等开发工具 附带基于3D Real Car训练模型及使用SuperSplat移除杂点的作业 [8] - 第二章深入讲解3DGS原理和算法 包括核心伪代码 以及动态重建、表面重建、鱼眼重建和光线追踪的经典与最新算法 实战选用英伟达开源的3DGRUT框架 [9] - 第三章聚焦自动驾驶仿真重建 重点讲解浙大Street Gaussian、上交OmniRe和浙大Hierarchy UGP三篇工作 实战选用学术界和工业界使用较多的DriveStudio [10] - 第四章探讨3DGS重要研究方向 包括COLMAP扩展、深度估计及重光照(Relighting) 并分享这些方向如何服务工业界及未来走势 [11] - 第五章讲解前馈3DGS(Feed-Forward 3DGS) 梳理其发展历程和算法原理 并讲解最新的AnySplat和WorldSplat算法工作 [12] - 第六章为线上答疑讨论 内容涉及3DGS岗位需求、行业痛点及开放性问题 [13] 课程安排与面向人群 - 课程于12月1日开课 预计两个半月结课 采用离线视频教学 辅以VIP群答疑及三次线上答疑 [15] - 课程章节解锁时间安排如下:第一章12月1日 第二章12月7日 第三章1月7日 第四章1月21日 第五章2月4日 [15] - 学习本课程需要自备GPU 推荐算力在RTX 4090及以上 并需具备一定的计算机图形学基础、对视觉重建/NeRF/3DGS等技术的了解、概率论与线性代数基础、以及Python和PyTorch语言基础 [17] - 课程目标使学员掌握3DGS完善的理论知识及相关技术栈、掌握算法开发框架并能训练开源模型、与学术界及工业界同行持续交流 对实习、校招、社招均有助益 [17]
摸底GS重建在自动驾驶业内的岗位需求......
自动驾驶之心· 2026-01-19 17:04
行业需求与岗位分析 - 有企业在2026年计划在重建方向投入招聘名额(HC) [2] - 重建技术主要用于自动驾驶测试的闭环仿真 具体流程是对离线片段(clip)数据用3D高斯泼溅(3DGS)重建动静态元素 以验证新模型能否预测合理轨迹并正常行驶 [2] - 支撑闭环仿真中重建优化的算法团队 一般公司需要5至20人 [3] - 云端数据生产也有需求 例如BEV视角下的静态路面重建(2DGS)可应用于静态真值生产 [3] - 小米的ParkGaussian将GS技术应用到泊车场景中 [3] - 综合来看 每个技术方向都需要至少10人左右的算法团队来支撑最基本的功能需求 [3] 技术发展路径与学习资源 - 3DGS领域较新 缺乏有效学习资料 对初学者困难 [3] - 梳理出的明确技术发展路线为:静态重建3DGS → 动态重建4DGS → 表面重建2DGS → 场景重建混合GS → 前馈GS [3] - 为应对学习需求 推出了《3DGS理论与算法实战教程》 花费两个月时间设计了一套从原理到实战的学习路线图 [3] 课程核心内容与结构 - 课程旨在帮助学员全面掌握3DGS技术栈 [3] - 第一章讲解3DGS背景知识 包括计算机图形学基础、三维空间表达、渲染管线、光线追踪、辐射场渲染 以及COLMAP、Gsplat等开发工具 并设有基于3D Real Car训练模型的小作业 [8] - 第二章深入讲解3DGS原理与算法 包括核心伪代码、动态重建、表面重建、鱼眼重建和光线追踪的经典与最新算法 实战选用英伟达开源的3DGRUT框架 [9] - 第三章聚焦自动驾驶仿真重建 重点讲解Street Gaussian、OmniRe和Hierarchy UGP三篇工作 实战选用DriveStudio框架 [10] - 第四章探讨3DGS重要研究方向 包括COLMAP扩展、深度估计及Relighting 并分析其工业界应用与学术前景 [11] - 第五章讲解前馈3DGS(Feed-Forward 3DGS) 梳理其发展历程与算法原理 并解析AnySplat和WorldSplat两篇最新算法工作 [12] - 第六章为线上答疑讨论 涉及3DGS岗位需求、行业痛点及开放性问题 [13] 课程安排与面向人群 - 课程为离线视频教学 辅以VIP群答疑及三次线上答疑 [15] - 课程于12月1日开课 预计两个半月结课 [15] - 章节解锁时间安排:第一章12月1日 第二章12月7日 第三章1月7日 第四章1月21日 第五章2月4日 [15] - 面向具备一定计算机图形学、视觉重建(如NeRF、3DGS)、概率论与线性代数基础 以及Python和PyTorch语言基础的学员 [17] - 学员需自备GPU 推荐算力在RTX 4090及以上 [17] - 课程目标使学员掌握3DGS完善的理论知识及相关技术栈、算法开发框架 并能与学术界及工业界同行持续交流 [17]
小米&杭电提出ParkGaussian:业内首个泊车场景重建算法,效果还不错
自动驾驶之心· 2026-01-07 17:44
ParkGaussian技术方案概述 - 小米汽车与杭州电子科技大学联合提出首个专为泊车场景三维重建设计的框架ParkGaussian,该框架将3D高斯泼溅技术适配于环视鱼眼传感器,并创新性地引入车位感知重建策略,以提升下游车位检测任务的性能[2][5][8] - ParkGaussian的核心贡献包括构建了首个泊车场景重建基准数据集ParkRecon3D,提出了融合无迹变换投影与可微分逆透视映射的技术方案,以及通过车位检测器提供任务驱动的监督信号,优化关键区域的重建保真度[8][13][16][20] ParkRecon3D基准数据集 - 该数据集基于AVM-SLAM开源数据扩展,采集于一个面积约24200平方米(220米×110米)、包含超过430个停车位的地下停车场,旨在解决泊车场景缺乏专用三维重建数据集的问题[11] - 数据集包含超过4万帧同步的多鱼眼相机图像(分辨率1280×960,采集频率10Hz)、6万个经过人工验证的停车位标注,以及通过COLMAP标定的相机外参,为模型训练与评估提供了全面的数据基础[5][8][11] 技术创新与核心方法 - **无迹变换投影**:为解决鱼眼相机强畸变下的投影问题,ParkGaussian集成了基于无迹变换的投影方法,无需为每个相机模型推导雅可比矩阵,在复杂条件下能生成更稳定的2D高斯足迹,提升了地下停车场景的几何重建稳定性[13][14][15] - **可微分逆透视映射**:通过一个完全可微分的IPM模块,将渲染的环视鱼眼图像转换为与下游检测器几何假设统一的鸟瞰图表示,使梯度能够反向传播至3D高斯表示,实现重建过程与下游感知任务的直接对齐[16][18][19] - **车位感知重建策略**:策略利用预训练的车位检测器(DMPR-PS和GCN-Parking)提取结构特征,通过构建混合车位感知权重图,将监督焦点集中在车位角点及边缘等高置信度关键几何区域,从而同步优化重建的视觉保真度与感知对齐度[20][25][32][33] 实验性能与结果 - **新视图合成质量**:在ParkRecon3D数据集上,ParkGaussian取得了最先进的渲染质量指标,例如在Scene1中,结合GCN-Parking的变体获得了PSNR 30.09、SSIM 0.93、LPIPS 0.20的优异表现,显著优于3DGUT、OmniRe等基线方法[47][48] - **下游车位检测性能**:车位感知重建策略大幅提升了停车位检测的精确率与召回率,例如在Scene1中,使用完整策略的ParkGaussian配合GCN-Parking检测器,精确率达到0.97,召回率达到0.43,接近在真实图像上的检测性能(精确率0.99,召回率0.49)[49][50] - **消融实验验证**:消融研究表明,完整的车位感知策略(融合教师-学生加权与分布对齐)在渲染质量与下游任务性能上均优于仅使用IPM监督、仅特征级监督或单一权重监督的变体,证实了结构先验与预测一致性结合的重要性[52][53][54] 行业意义与应用前景 - 该研究针对自动驾驶泊车这一关键任务,首次系统性地解决了地下停车场等无GPS、狭窄拥挤场景的高质量三维重建与仿真难题,弥补了现有驾驶仿真器主要关注道路场景的不足[2][3][4] - ParkGaussian框架及ParkRecon3D数据集为自动泊车系统的开发、训练与性能评估提供了高保真、与感知任务对齐的仿真工具,有望推动泊车感知、规划与控制等下游算法的进步[5][8][57]