NeRF
搜索文档
做了一份3DGS的学习路线图,面向初学者
自动驾驶之心· 2025-11-22 10:01
文章核心观点 - 3D高斯泼溅(3DGS)技术,特别是前馈式3DGS(Feed-Forward GS),正成为自动驾驶、医疗、虚拟现实和游戏等领域的新兴重要技术栈 [2] - 场景重建或世界模型是行业急需攻克的关键场景,其中自动驾驶的业内闭环是核心痛点 [4] - 为满足行业需求,推出了《3DGS理论与算法实战教程》,旨在系统性地讲解从原理到实战的知识,帮助学习者全面掌握3DGS技术栈 [6] 技术应用与行业需求 - 3DGS技术已在多个领域获得广泛应用,主流技术方向包括2DGS、3DGS、4DGS和前馈GS [2] - 自动驾驶行业对场景重建和世界模型有迫切需求,业内闭环是真正的技术痛点 [4] - 传统三维重建领域也存在技术升级的刚需 [4] 课程内容与结构 - 课程核心算法涵盖静态重建3DGS、动态重建4DGS、表面重建2DGS、前馈式3DGS以及量产问题讨论 [6] - 课程设计思路是从计算机图形学基础讲起,逐步深入到3DGS原理、自动驾驶应用及前沿研究方向 [10][11][12][13][14] - 课程包含六个章节:3DGS背景知识、原理算法、自动驾驶应用、研究方向、前馈式3DGS及答疑讨论 [10][11][12][13][14][15] - 课程采用离线视频教学,配合VIP群内答疑和三次线上答疑,学习周期预计两个半月 [17] 课程具体章节重点 - 第一章重点讲解计算机图形学基础,包括三维空间表达、渲染管线及3DGS开发工具如SuperSplat、COLMAP和Gsplat [10] - 第二章深入讲解3DGS原理、核心伪代码及动态重建、表面重建等算法,实战部分使用英伟达开源3DGRUT框架 [11] - 第三章聚焦自动驾驶仿真重建,重点分析Street Gaussian、OmniRe和Hierarchy UGP三篇工作,实战使用DriveStudio [12] - 第四章探讨3DGS重要研究方向,包括COLMAP扩展、深度估计及Relighting,并分析其工业界应用与学术前景 [13] - 第五章梳理前馈式3DGS的发展历程与原理,讲解AnySplat和WorldSplat等最新算法 [14] 目标人群与学习收获 - 课程面向具备一定计算机图形学基础、了解视觉重建技术、并拥有Python和PyTorch基础的学习者 [19] - 学习者需自备GPU,推荐算力在RTX 4090及以上 [19] - 学后收获包括掌握3DGS理论知识和技术栈、熟悉算法开发框架、并能与学术界及工业界同行持续交流 [19]
3DGS重建!gsplat 库源码解析
自动驾驶之心· 2025-09-24 07:32
作者 | 微卷的大白 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/1952449084788029155 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 前两天看到李飞飞 Worldlabs 新工作Mrable的时候,提到后面想多看一看 3DGS / 重建相关的工作。 不过如果真的有小白要踩坑 ,gsplat 的文档和维护其实比gaussian-splatting 要稍微好一些,个人更推荐这个库。 相比3DGS 论文对应的 gaussian-splatting 库,nerfstudio-projectgsplat 是对官方库做了一些优化,可参考https://docs.gsplat.studio/main/migration/migration_inria.html 的 说明。 但是知乎搜了一下发现,讲 3DGS 论文原理、改进的不少,我自己上半年也回顾过cuda kernel 源码:重温经典之 3DGS CUDA 源码解析 ,但是另一个常用的gsplat ...
自动驾驶之心技术交流群来啦!
自动驾驶之心· 2025-07-29 15:53
自动驾驶技术交流平台 - 公司是国内领先的自动驾驶技术交流平台 专注于自动驾驶产业 学术与职场成长等领域 [1] - 平台提供技术交流群 涵盖大模型 端到端 VLA BEV感知 多模态感知等前沿技术方向 [1] - 交流范围包括感知 规划控制 仿真测试 硬件配置等自动驾驶全产业链环节 [1] - 平台面向企业 高校研究人员开放 需提供公司/学校 昵称和研究方向信息加入 [1]
一个md文件收获超400 star,这份综述分四大范式全面解析了3D场景生成
机器之心· 2025-06-10 16:41
3D场景生成技术综述 核心观点 - 南洋理工大学S-Lab系统梳理300+篇论文,将3D场景生成方法划分为四大技术范式:程序化生成、基于神经网络的3D表示生成、图像驱动生成、视频驱动生成 [2] - 领域自2021年起进入爆发期,主要驱动力为扩散模型、NeRF、3D Gaussians等新技术涌现 [4] - 当前技术面临生成能力不均衡、3D表征缺陷、数据瓶颈、评估标准缺失四大挑战 [16] - 未来发展方向聚焦高保真生成、物理约束引入、交互式场景、感知-生成一体化四大方向 [12][18] 技术路线分类 程序化生成 - 通过预定义规则/LLM先验自动构建复杂环境(如城市、地形),具备空间一致性优势 [8] - 细分方法包括基于规则生成(地形)、约束优化生成(室内)、LLM辅助生成(布局控制) [8] 神经网络3D表示生成 - 直接生成场景图/参数或3D表征(点云/NeRF/3D高斯),具备强三维理解能力 [8] 图像驱动生成 - 基于2D图像生成模型重建3D结构,包括整体生成(全景图)和迭代生成(图像序列) [9][14] 视频驱动生成 - 融合时空一致性,分为一阶段(端到端)和两阶段(时空分离控制)方法 [9][15] 性能评估维度 - 七大关键指标:真实感、多样性、视角一致性、语义一致性、效率、可控性、物理真实性 [7] - 不同方法在可控性/真实性/效率/一致性之间存在显著权衡关系 [7] 下游应用领域 - 覆盖3D场景编辑、人-场景交互、具身智能、机器人、自动驾驶等关键场景 [2] 未来技术突破方向 - 高保真生成需协调几何/纹理/光照/多视角一致性,提升材质建模与细节捕捉能力 [12] - 物理约束引入需结合可微分物理模拟器,保障物体移动/摆放符合真实规律 [18] - 交互式场景需实现动态响应能力,理解物体可用性/因果关系/多智能体逻辑 [18] - 感知-生成一体化需构建统一架构,双向增强场景理解与生成准确性 [18]