3DGS
搜索文档
摸底GS重建在自动驾驶业内的岗位需求
自动驾驶之心· 2026-01-24 10:55
行业需求与岗位分析 - 有企业在2026年需要在重建方向投入招聘名额(HC) [2] - 重建技术主要用于自动驾驶测试的闭环仿真 具体流程是对离线片段(clip)数据用3D高斯泼溅(3DGS)重建动静态元素 以验证新模型能否预测合理新轨迹并正常行驶 [2] - 支撑闭环仿真中重建优化一般需要5至20人的算法团队 [3] - 云端数据生产也存在需求 例如BEV视角下的静态路面重建(2DGS)可应用于静态真值生产 [3] - 小米的ParkGaussian将GS技术应用到泊车场景中 [3] - 每个技术方向至少需要10人左右的算法团队规模来支撑最基本功能需求 [3] 技术发展路线与学习资源 - 3D高斯泼溅(3DGS)领域较新 缺乏有效学习资料 对初学者存在困难 [3] - 梳理出的明确技术发展路线为:静态重建3DGS → 动态重建4DGS → 表面重建2DGS → 场景重建混合GS → 前馈GS [3] - 为应对学习需求 推出了《3DGS理论与算法实战教程》 花费两个月时间设计了一套从原理到实战的学习路线图 [3] 课程内容与结构 - 课程第一章讲解3DGS背景知识 包括计算机图形学基础、三维空间表达、渲染管线、光线追踪、辐射场渲染 并介绍SuperSplat、COLMAP、Gsplat等开发工具 附带基于3D Real Car训练模型及使用SuperSplat移除杂点的作业 [8] - 第二章深入讲解3DGS原理和算法 包括核心伪代码 以及动态重建、表面重建、鱼眼重建和光线追踪的经典与最新算法 实战选用英伟达开源的3DGRUT框架 [9] - 第三章聚焦自动驾驶仿真重建 重点讲解浙大Street Gaussian、上交OmniRe和浙大Hierarchy UGP三篇工作 实战选用学术界和工业界使用较多的DriveStudio [10] - 第四章探讨3DGS重要研究方向 包括COLMAP扩展、深度估计及重光照(Relighting) 并分享这些方向如何服务工业界及未来走势 [11] - 第五章讲解前馈3DGS(Feed-Forward 3DGS) 梳理其发展历程和算法原理 并讲解最新的AnySplat和WorldSplat算法工作 [12] - 第六章为线上答疑讨论 内容涉及3DGS岗位需求、行业痛点及开放性问题 [13] 课程安排与面向人群 - 课程于12月1日开课 预计两个半月结课 采用离线视频教学 辅以VIP群答疑及三次线上答疑 [15] - 课程章节解锁时间安排如下:第一章12月1日 第二章12月7日 第三章1月7日 第四章1月21日 第五章2月4日 [15] - 学习本课程需要自备GPU 推荐算力在RTX 4090及以上 并需具备一定的计算机图形学基础、对视觉重建/NeRF/3DGS等技术的了解、概率论与线性代数基础、以及Python和PyTorch语言基础 [17] - 课程目标使学员掌握3DGS完善的理论知识及相关技术栈、掌握算法开发框架并能训练开源模型、与学术界及工业界同行持续交流 对实习、校招、社招均有助益 [17]
2025年几家自动驾驶公司的采访总结
自动驾驶之心· 2026-01-22 17:07
核心观点 - 自动驾驶行业在核心算法层面已形成共识,即采用端到端(End-to-End)作为基础架构,并引入世界模型(World Model)作为关键基础设施 [6][7][10] - 行业在顶层认知上出现路线分歧,主要围绕是否在端到端模型中引入语言模型(即VLA与WA/反VLA之争),这本质上是计算效率与推理能力(快思考 vs 慢思考)的不同权衡 [7][11] - 未来三年是现有深度学习范式的“极致优化期”,核心在于通过海量数据驱动能力自然生长,而非理论重构 [7] - 行业竞争已超越单纯算法模型之争,研发基建、数据仿真、算力芯片、工程化能力及用户体验等非技术因素成为决定成败的关键变量 [13] 核心技术路线 端到端 (End-to-End) - 是自动驾驶的底层基座,替代了传统的模块化方案,直接从传感器输入映射到控制输出 [1][10] - 一段式端到端(One-Stage E2E)已被验证可行(如特斯拉FSD V12),统一了L2和L4的开发范式 [7] - 其局限性主要是“模仿学习”,能力上限受限于训练数据,缺乏逻辑推理 [12] 世界模型 (World Model) - 是核心算法演进中的关键基础设施,扮演“中间加速器”的角色 [7][10] - 主要作用分为两方面: - **对内(训练)**:作为“超级模拟器”,生成大量合成数据以解决长尾问题,并让端到端模型在虚拟环境中通过强化学习反复试错迭代,实现从“数据闭环”到“训练闭环”的演进 [2][8][11][18] - **对外(推理)**:作为“预测机”,帮助车辆理解物理规律和因果关系,直接指导动作生成 [9][11] - 3DGS(3D Gaussian Splatting)是构建高保真仿真环境的重要技术 [3] 视觉-语言-动作模型 (VLA) 与 世界-动作模型 (WA) - **VLA派(理想、英伟达)**:认为需要引入大语言模型赋予车辆逻辑推理(Chain of Thought)和解释能力,以处理复杂、罕见的长尾场景(System 2,慢思考) [9][11][12] - **WA/反VLA派(华为、小鹏)**:认为驾驶主要是直觉反应,引入语言环节会增加延迟和算力负担,主张直接从世界模型理解映射到动作(System 1,快思考) [9][11] - **务实派(小米)**:当前主推“端到端+世界模型+强化学习”解决直觉问题,内部预研VLA以备复杂推理需求,追求“智能密度”最大化 [9][11] 主要公司技术选择对比 | 公司 | 核心技术路线选择 | 核心逻辑与观点 | 世界模型/仿真工具的角色 | | :--- | :--- | :--- | :--- | | **理想汽车** | VLA (Vision-Language-Action) | 认知驱动,认为需从“模仿”进化到“自己学会”,单纯数据闭环不够,必须走向训练闭环 [9] | 利用《World4Drive》等模型构建可探索的虚拟世界,进行策略优化,是训练闭环的核心 [9] | | **英伟达 (NVIDIA)** | 物理AI + VLA (Alpamayo) | 强调AI的可解释性与推理能力,不仅要会开,还要能解释决策,并强调“Test time Scaling”(让AI多思考一会儿) [9] | 使用Omniverse & Cosmos生成合成数据和进行物理模拟,训练车辆学习物理定律 [9] | | **小米汽车** | 端到端 + 世界模型 + 强化学习 (预研VLA) | 智能密度最大化,当前方案优先解决“直觉”(System 1)问题,VLA类似“看悬疑片”(System 2),仅用于极复杂场景,不制造技术焦虑 [9][17] | 使用高保真模拟器进行强化学习训练,解决实车难以覆盖的长尾场景 [9] | | **地平线** | 一段式端到端 (One-Stage) | 范式统一,认为FSD V12证明了端到端的可行性,未来三年是“极致优化期”,旨在统一L2与L4的开发范式 [9] | 未详细展开,主要强调通过统一范式和低成本部署打通壁垒 [9] | | **华为 / 小鹏** | WA (World Action) / 反VLA | 去语言化,认为驾驶主要是直觉反应,不需要经过语言环节,以降低延迟和算力负担 [9] | 利用世界模型理解环境演变,直接指导动作生成 [9] | 非核心技术关键因素 研发基建与工程效率 - 基建(以数据为核心的研发效能)决定迭代速度,好的基建能大幅提升研发效率,例如小米能在一年内实现“追三代”的技术跨越,核心在于云端基建的复用和自动化率提升 [3][18] - 基建的好坏取决于发现问题后,能否迅速从海量数据中挖掘出类似场景,并形成高质量标注数据进行训练 [18] - 强化工程能力和组织能力被视为公司的“工业母机”,是应对技术范式变化的确定性方法 [18] 仿真与合成数据 - 仿真成为解决长尾问题(Corner Case)的核心,单纯依赖真实路测数据已无法满足需求 [14] - 合成数据价值极高,例如在小米的训练数据中,仿真数据占比约为20%,但节省了数倍的人力成本 [18] - 英伟达通过Cosmos世界模型生成符合物理定律的合成数据来训练自动驾驶模型 [18] - 理想汽车等公司强调从“数据闭环”走向“训练闭环”,让AI在虚拟世界中进行强化学习,自我探索最优策略 [18] 算力规模与芯片适配 - 智驾是算力和硬件的“暴力美学”,计算机工业的本质就是“玩命堆算力” [15][18] - 英伟达发布Rubin平台以应对每年增长5倍的AI推理需求,旨在将推理成本降低至原来的1/10 [18] - 算法上车面临巨大的“部署偏差”,从一颗芯片迁移到另一颗芯片通常需要6-10个月解决算子支持、计算精度对齐等问题,这种高昂的迁移成本构成了芯片厂商的护城河 [18] - 随着AI进行长序思考(System 2),车载芯片的“显存”面临巨大挑战 [18] 商业化成本与泛化能力 - 技术再先进也需考虑成本,智驾系统的目标是将L4级体验以极低的部署成本普及到10万元级别车型 [18] - 新一代端到端技术通过数据驱动,在一个复杂城市验证后,能大概率泛化到整个国家,极大地降低了扩张成本 [18] 用户体验与安全冗余 - 技术先进性不等于体验更好,必须在收益和风险之间取得平衡,避免为了“显摆技术”而制造焦虑 [17] - 安全机制至关重要,即便是激进的端到端方案也需要安全兜底,例如英伟达的方案中包含了一个经典的规则驱动AV栈作为安全护栏,在端到端模型信心不足时回退 [19]
马斯克想明白了FSD的下一步方向......
自动驾驶之心· 2026-01-17 11:08
特斯拉FSD商业模式重大转变 - 特斯拉将于2026年2月14日正式下架FSD一次性永久买断方案,转向SaaS订阅模式 [1] - 在美国市场,一次性买断价格为8000美元,月度订阅价格将降至99美元/月,买断成本相当于连续订阅81个月 [2] - 在中国市场,FSD买断价格约为6.4万元人民币,月度订阅费用预计在499元至699元人民币之间 [2] FSD技术进展与市场准入 - 特斯拉自动驾驶负责人披露,FSD沿用端到端VA主架构,并持续优化,输出全景分割、3D OCC、3D Gaussian等信息辅助Action优化 [2] - 3D Gaussian的闭环仿真能力是技术亮点,推测是前馈GS+生成联合的效果 [2] - 马斯克于去年11月透露,FSD在中国已获“部分批准”,有望在2026年2月或3月左右获得全面批准 [2] - 据消息,特斯拉FSD或于2026年1月22日至23日正式在中国国内推出 [2] 行业技术趋势与竞争格局 - 从2023年提出端到端到2025年,FSD的技术路线与国内主流线路基本一致,未来重点在于用户认可和工程优化 [3] - 行业观点认为自动驾驶领域将进入“苦日子”阶段,意味着竞争加剧和盈利挑战 [3] 特斯拉Optimus机器人发展前景 - 硅谷天使投资人Jason在节目中透露已见到Optimus V3,并给予极高评价 [3] - 其观点认为,未来无人会记得特斯拉制造过汽车,只会记得Optimus,并预测其将生产10亿台,成为人类历史上最具变革性的科技产品 [3]
开年收到了很多同学关于自驾方向选择的咨询......
自动驾驶之心· 2026-01-06 17:17
自动驾驶领域学术研究趋势与方向 - 行业观察到自动驾驶领域的研究方向呈现前沿与差异化并存的格局 前沿方向包括视觉语言模型、端到端自动驾驶、强化学习、3D高斯泼溅和世界模型[2] 相对竞争较少的赛道包括开集目标检测、占据网络以及小样本/零样本学习[2] - 针对不同专业背景的研究者 行业建议采用差异化的学习路径 计算机和自动化背景的研究者更适合深度学习相关的前沿方向 如视觉语言模型、端到端和世界模型 因其在职业和学术发展上空间广阔[2] 机械和车辆背景的研究者则建议从传统规划与控制、3D高斯泼溅等方向入手 这些方向对算力要求较低且更易入门[2] - 行业普遍认为 研究能力的提升依赖于持续的方法论训练 包括大量阅读论文、积极交流并逐步形成独立的思考和创意[2] 论文辅导服务覆盖的研究方向 - 公司提供的论文辅导服务覆盖了自动驾驶领域广泛的研究与技术方向[3] 核心感知方向包括端到端模型、视觉语言模型、3D目标检测、BEV感知、占据网络、语义分割、轨迹预测、单目感知以及车道线与在线高精地图构建[3] - 服务同时涵盖规划控制与前沿模型技术 具体包括运动规划、强化学习、扩散模型、流匹配[3] 在多模态融合与特定传感器领域 服务涉及多传感器融合、点云感知和毫米波雷达感知[3] - 其他支持的研究方向还包括3D高斯泼溅和多任务学习[3] 论文辅导服务内容与成果 - 公司提供的核心服务包括论文选题、论文全流程指导以及实验指导[6] - 服务延伸至博士申请指导领域[7] - 公司宣称其中稿率很高 并有大量论文被顶级会议和期刊收录 包括CVPR、AAAI、ECCV、CoRL、ICLR、IROS、ICRA、ACL等[7] 论文辅导服务的目标发表渠道 - 公司辅导的论文目标发表渠道涵盖自动驾驶领域的顶级会议 包括CCF-A、CCF-B、CCF-C等级别的会议[10] - 目标期刊包括SCI一区至四区 以及中科院分区的一区至四区期刊[10] - 服务也支持EI检索期刊、中文核心期刊的发表 并覆盖毕业设计论文、博士申请以及竞赛相关的论文需求[10]
为什么前馈GS引起业内这么大的讨论?
自动驾驶之心· 2025-12-28 17:23
特斯拉自动驾驶技术方向 - 特斯拉在ICCV的分享指明了智能驾驶下一阶段发展方向为端到端+生成式3D高斯泼溅[2] - 特斯拉的实践基本可以判断是基于前馈式3D高斯泼溅算法实现的[2] 3D高斯泼溅技术演进路线 - 技术发展路线明确:从静态重建3DGS演进至动态重建4DGS,再到表面重建2DGS、场景重建混合GS,最终到前馈GS[3] - 前馈式3D高斯泼溅因能摆脱以往单场景优化的弊端,训练、推理、测试在一个统一架构内而受到国内重视[3][6] - 该技术可实现百毫秒级别的实时性,这是以往重建算法难以达到的水平[6] - 该技术可与世界模型结合,通过生成+重建打造更优的闭环仿真能力[6] 行业培训课程核心内容 - 课程旨在全面讲解3D高斯泼溅技术栈,从原理到实战细致展开[3] - 课程第一章涵盖计算机图形学基础,包括三维空间的隐式/显式表达、渲染管线、光线追踪、辐射场渲染,并介绍COLMAP、Gsplat等主流工具,附带基于3D Real Car训练模型的小作业[8] - 课程第二章深入3D高斯泼溅原理与算法,涵盖动态重建、表面重建、鱼眼重建和光线追踪的经典与最新算法,实战选用英伟达开源的3DGRUT框架[9] - 课程第三章聚焦自动驾驶仿真重建,解析Street Gaussian、OmniRe和Hierarchy UGP三篇核心工作,实战选用DriveStudio框架[10] - 课程第四章探讨3D高斯泼溅重要研究方向,包括COLMAP扩展、深度估计及Relighting,并分析其工业界应用与学术前景[11] - 课程第五章专讲前馈式3D高斯泼溅,梳理其发展历程与原理,并讲解AnySplat和WorldSplat两篇最新算法工作[12] - 课程第六章为线上答疑讨论,涉及3D高斯泼溅岗位需求、行业痛点及开放性问题[13] 课程安排与面向人群 - 课程开课时间为12月1日,预计两个半月结课,采用离线视频教学与VIP群答疑结合模式[15] - 课程章节按计划解锁:第一章于12月1日解锁,第二章于12月7日解锁,第三章于1月7日解锁,第四章于1月21日解锁,第五章于2月4日解锁[15] - 课程面向具备一定计算机图形学、视觉重建、NeRF、3D高斯泼溅基础知识,以及概率论、线性代数、Python和PyTorch基础的学习者[17] - 学习者需自备GPU,推荐算力在RTX 4090及以上[17] - 完成课程可掌握3D高斯泼溅完善的理论知识及相关技术栈、算法开发框架,并能与学术界及工业界同行持续交流[17]
收到很多同学关于自驾方向选择的咨询......
自动驾驶之心· 2025-12-26 17:18
自动驾驶领域学术研究趋势与方向 - 行业观察到计算机、车辆、自动化和机械等专业背景的学生对自动驾驶研究方向存在普遍困惑,特别是在入门和选择前沿方向上[2] - 行业将自动驾驶研究方向分为前沿方向与相对不拥挤的赛道,前沿方向包括视觉语言动作模型、端到端自动驾驶、强化学习、3D高斯泼溅和世界模型,相对不拥挤的赛道包括开集目标检测、占用网络以及少样本/零样本学习[2] - 针对不同专业背景的学生,行业给出了差异化的学习路径建议,对于自动化和计算机背景的学生,建议专注于深度学习相关的前沿方向,如视觉语言动作模型、端到端和世界模型,这些方向被认为从入门到工作乃至读博都有很大发展空间,对于机械和车辆背景的学生,建议从传统规划与控制或3D高斯泼溅等对算力要求较低、入手更简单的方向开始[2] - 行业强调方法论提升的重要性,建议研究者通过多阅读论文和交流来逐步形成自己的思考与想法,并指出新人研究者通常需要经历多次试错才能产生好的想法[2] 论文辅导服务覆盖的研究方向 - 公司提供的论文辅导服务覆盖了自动驾驶领域的众多前沿与关键技术方向,包括但不限于端到端自动驾驶、视觉语言动作模型、世界模型、强化学习、3D目标检测、多传感器融合、3D高斯泼溅、鸟瞰图感知、占用网络、多任务学习、语义分割、轨迹预测、运动规划、扩散模型、流匹配、点云感知、毫米波雷达感知、单目感知以及车道线/在线高精地图构建等[3] 论文辅导服务内容与成果 - 公司提供的核心服务包括论文选题、论文全流程指导以及实验指导[6] - 此外,公司还提供博士申请指导服务[7] - 公司宣称其辅导服务的中稿率很高,并且已有辅导完成的论文被计算机视觉、人工智能、机器人、自然语言处理等领域的顶级会议和期刊收录,例如CVPR、AAAI、ECCV、CoRL、ICLR、IROS、ICRA、ACL等[7] 论文辅导服务的目标发表范围 - 公司的论文辅导服务旨在帮助客户在广泛的学术出版物上发表成果,目标范围包括自动驾驶领域的顶级会议和期刊,涵盖中国计算机学会推荐的A、B、C类会议/期刊,科学引文索引的一区至四区期刊,中国科学院分区的一区至四区期刊,以及工程索引和中文核心期刊,同时也涵盖毕业设计论文、博士申请和学术比赛等相关需求[10]
前馈GS在自驾场景落地的难点是什么?
自动驾驶之心· 2025-12-26 11:32
课程核心内容与结构 - 课程旨在提供一套全面的3D高斯泼溅技术学习路线图,从原理到实战,帮助学员掌握3DGS技术栈 [2] - 课程由自动驾驶之心联合工业界算法专家设计,历时两个月开发 [2] - 课程采用离线视频教学,配合VIP群答疑及三次线上答疑,开课时间为12月1日,预计两个半月结课 [13] 讲师背景 - 讲师Chris拥有QS20硕士学位,现任某Tier1厂商算法专家 [3] - 讲师从事端到端仿真、多模态大模型、世界模型等前沿算法的预研和量产,并参与过全球TOP主机厂的仿真引擎及工具链开发 [3] - 讲师拥有丰富的三维重建实战经验 [3] 课程大纲详解 - **第一章:3DGS的背景知识**:概述计算机图形学基础,包括三维空间的隐式/显式表达、渲染管线、光线追踪、辐射场渲染,并介绍COLMAP、SuperSplat、Gsplat等开发工具,附带基于3D Real Car训练模型的小作业 [6] - **第二章:3DGS的原理和算法**:详细梳理3DGS原理及核心伪代码,讲解动态重建、表面重建、鱼眼重建和光线追踪的经典与最新算法,实战部分使用英伟达开源的3DGRUT框架 [7] - **第三章:自动驾驶3DGS**:聚焦自动驾驶仿真重建,讲解浙大Street Gaussian、上交OmniRe和浙大Hierarchy UGP三篇工作,实战使用学术界和工业界广泛采用的DriveStudio [8] - **第四章:3DGS重要的研究方向**:探讨COLMAP扩展、深度估计及Relighting等研究方向,并分析其工业界应用与学术前景 [9] - **第五章:Feed-Forward 3DGS**:梳理前馈3DGS的发展历程与算法原理,讲解最新的AnySplat和WorldSplat算法工作 [10] - **第六章:答疑讨论**:通过线上交流形式,讨论3DGS岗位需求、行业痛点及开放性问题 [11] 课程面向人群与学后收获 - **面向人群**:课程要求学员自备GPU,推荐算力在4090及以上,并具备计算机图形学基础、对视觉重建/NeRF/3DGS有一定了解、有概率论与线性代数基础、熟悉Python和PyTorch [15] - **学后收获**:学员将掌握3DGS完善的理论知识及相关技术栈、掌握算法开发框架并能训练开源模型、可与学术界及工业界同行持续交流,对实习、校招、社招均有助益 [15] 行业技术动态与课程关联 - 前馈3DGS是当前热门方向,旨在克服传统“per-scene optimization”的不便,但其在点云精度上仍有不足,尤其在私有数据域上精度不稳定 [2] - 课程内容紧密联系行业前沿,如第三章聚焦自动驾驶仿真,第五章专门探讨Feed-Forward 3DGS [8][10]
最近Feed-forward GS的工作爆发了
自动驾驶之心· 2025-12-22 08:42
3D高斯泼溅技术在自动驾驶领域的发展与应用 - 特斯拉在ICCV的分享中引入3D高斯泼溅技术,成为一大亮点,表明其可能基于前馈式GS算法实现 [2] - 学术界近期涌现大量相关工作,例如小米的WorldSplat和清华的DGGT,显示3DGS技术正在自动驾驶领域焕发新一轮生机 [2] - 行业普遍共识是采用前馈式GS重建场景,并利用生成技术生成新视角,多家公司正开放HC招聘相关人才 [2] 3D高斯泼溅技术的快速迭代与学习需求 - 3DGS技术迭代速度极快,已从静态重建3DGS、动态重建4DGS、表面重建2DGS,发展到前馈式3DGS [4] - 初学者入门面临挑战,需同时掌握点云处理、深度学习理论以及实时渲染、代码实战等技能 [4] - 为应对学习需求,推出了《3DGS理论与算法实战教程》,旨在提供从原理到实战的完整学习路线图 [4] 课程核心内容与结构 - **第一章:背景知识**:涵盖计算机图形学基础,包括三维空间表达、渲染管线、光线追踪等,并介绍COLMAP、Gsplat等开发工具,设置基于3D Real Car训练模型的入门作业 [8] - **第二章:原理和算法**:详细梳理3DGS原理及核心伪代码,讲解动态重建、表面重建等经典与最新算法,实战选用英伟达开源的3DGRUT框架 [9] - **第三章:自动驾驶应用**:聚焦自动驾驶仿真重建,重点讲解Street Gaussian、OmniRe和Hierarchy UGP三篇工作,实战选用DriveStudio框架 [10] - **第四章:重要研究方向**:探讨COLMAP扩展、深度估计及Relighting等方向,分析其工业界应用与学术探索价值 [11] - **第五章:前馈式3DGS**:梳理前馈式3DGS的发展历程与算法原理,讲解AnySplat和WorldSplat两篇最新算法工作 [12] - **第六章:答疑交流**:通过线上交流形式,讨论3DGS岗位需求、行业痛点及开放性问题 [13] 课程安排与面向人群 - 课程于12月1日开课,预计两个半月结课,采用离线视频教学配合VIP群及三次线上答疑的模式 [15] - 课程章节按计划解锁:第一章于12月1日,第二章于12月7日,第三章于1月7日,第四章于1月21日,第五章于2月4日 [15] - 面向具备一定计算机图形学、视觉重建、概率论与线性代数基础,并掌握Python和PyTorch的学员 [17] - 学员需自备GPU,推荐算力在4090及以上 [17] - 课程目标使学员掌握3DGS完善的理论知识、技术栈及算法开发框架,并能与学界及工业界同行交流,对实习、校招、社招均有助益 [17] 讲师背景与行业联系 - 讲师Chris拥有QS20高校硕士学位,现任某Tier1厂商算法专家,从事端到端仿真、多模态大模型、世界模型等前沿算法预研与量产 [5] - 讲师参与过全球顶级主机厂的仿真引擎及工具链开发,拥有丰富的三维重建实战经验 [5] - 课程由自动驾驶之心联合工业界算法专家打造,旨在全面吃透3DGS技术栈 [4]
最近收到了很多同学关于自驾方向选择的咨询......
自动驾驶之心· 2025-12-19 17:25
自动驾驶领域研究方向与人才需求 - 行业收到大量来自计算机、车辆、自动化和机械方向学生的咨询,显示该领域人才需求旺盛且背景多元 [2] - 对于计算机与自动化背景的学生,行业建议主攻深度学习方向,包括视觉语言模型、端到端自动驾驶和世界模型等前沿领域,这些方向被认为从入门到就业乃至深造均有广阔空间 [2] - 对于机械与车辆工程背景的学生,行业建议可从传统规划与控制、3D高斯泼溅等方向入手,这些方向对算力要求相对较低且更易入门 [2] - 行业指出,新人研究者需要经历大量实践与试错才能形成有价值的创新想法,方法论提升的关键在于广泛阅读论文和积极交流 [2] 前沿与细分技术赛道 - 行业关注的前沿研究方向包括视觉语言模型、端到端自动驾驶、强化学习、3D高斯泼溅和世界模型 [2] - 行业认为开集目标检测、占用网络、小样本/零样本学习等是相对竞争不那么激烈的细分赛道 [2] - 行业提供的论文辅导服务覆盖了广泛的技术方向,包括但不限于端到端、视觉语言模型、世界模型、强化学习、3D目标检测、多传感器融合、3D高斯泼溅、鸟瞰图感知、占用网络、多任务学习、语义分割、轨迹预测、运动规划、扩散模型、流匹配、点云感知、毫米波雷达、单目感知以及车道线/在线高精地图 [3] 学术成果与发表支持服务 - 行业提供的论文辅导服务声称具有很高的中稿率,并已有成果被计算机视觉、人工智能、机器人、自然语言处理等领域的顶级会议和期刊收录,例如CVPR、AAAI、ECCV、CoRL、ICLR、IROS、ICRA、ACL [7] - 服务支持发表的论文级别多样,涵盖自动驾驶顶会/顶刊、中国计算机学会推荐的A/B/C类会议期刊、科学引文索引的一至四区期刊、中科院分区的一至四区期刊、以及工程索引和中文核心期刊 [10] - 服务内容全面,包括论文选题、全流程指导以及实验指导 [6] - 服务范围不仅限于学术论文发表,还扩展至毕业设计论文、申请博士以及竞赛支持 [10] - 服务提供针对不同论文级别的差异化定价 [8]
SIGGRAPH Asia 2025:摩尔线程赢图形顶会3DGS挑战赛大奖,自研LiteGS全面开源
机器之心· 2025-12-17 13:28
文章核心观点 - 摩尔线程在SIGGRAPH Asia 2025的3DGS重建挑战赛中凭借自研的LiteGS技术获得银奖,证明了其在下一代图形渲染技术上的算法实力和软硬件协同能力[1] - 3DGS是一项革命性的3D场景表示与渲染技术,相比传统NeRF,能在保持画质的同时将渲染效率提升数百至上千倍,并被视为具身智能等前沿领域的关键基础技术[4][7] - 摩尔线程通过开源其全栈优化的3DGS基础库LiteGS,旨在推动技术开放协作,其方案在训练效率和模型轻量化上树立了新的性能标杆[18][24][27] 3DGS技术概述与行业意义 - 3DGS以可参数化的3D高斯分布为核心,实现了画质、效率与资源占用的卓越平衡[4] - 该技术为具身智能等需要与真实环境交互的领域提供了高质量、低延迟的三维环境建模支撑,有助于提升路径规划和环境感知能力[7] - 因其对未来图形学技术路线的关键意义,3DGS已成为全球学术界与产业界竞相投入的研究方向[8] SIGGRAPH Asia 2025挑战赛详情 - 竞赛任务极具挑战性,要求参赛者在60秒内,基于存在误差的相机轨迹和终端SLAM点云,完成完整的3DGS高质量重建[10] - 主办方以PSNR(重建质量)与重建速度为综合评价指标进行权威排名[12] - 比赛结果及数据集已向全球公开[13] 摩尔线程参赛表现与技术方案 - 摩尔线程AI团队以“MT-AI”参赛,在重建精度与效率上取得均衡表现,最终获得银奖[16] - 具体比赛数据显示,其方案平均PSNR为27.58,重建耗时34秒,在效率上显著领先多数队伍[17][20] - 公司自主研发的LiteGS基础库实现了从底层GPU系统、中层数据管理到高层算法设计的全链路协同优化[20][21] LiteGS技术的核心优势与性能数据 - 在GPU系统层面,创新提出基于“One Warp Per Tile”原则的“Warp-Based Raster”新范式,大幅降低梯度计算开销[21] - 在数据管理层,引入“聚类-剔除-压缩”流水线,显著提升数据局部性,减少缓存失效[21] - 在算法设计层,采用像素不透明度梯度方差作为致密化判据,精准识别欠拟合区域[21] - 性能表现突出:在达到同等质量时,LiteGS可获得高达10.8倍的训练加速,且参数量减少一半以上[25] - 在相同参数量下,LiteGS的PSNR指标超出主流方案0.2–0.4 dB,训练时间缩短3.8至7倍[29] - 针对轻量化模型,LiteGS仅需原版3DGS约10%的训练时间与20%的参数量,即可实现同等质量[29] 公司的战略布局与后续行动 - 此次获奖是公司准确把握全球技术发展趋势并引领未来图形计算技术方向的战略体现[28] - 公司计划在2025年12月20日至21日的首届MUSA开发者大会上设立技术专题,深入探讨3DGS等图形智能技术如何赋能具身智能等前沿领域[28] - 摩尔线程已将LiteGS在GitHub平台全面开源,以推动三维重建与渲染技术的开放协作与持续演进[27]