融合感知方案
搜索文档
Nullmax 徐雷:视觉能力将决定智驾系统上限,反对把激光雷达当 “拐棍”
晚点LatePost· 2025-12-04 20:09
自动驾驶技术路线之争 - 纯视觉方案以摄像头为核心传感器,模拟人类视觉感知道路,而融合感知方案则综合采用激光雷达、摄像头、毫米波雷达等多种传感器构建更强大的感知系统[5] - 行业存在技术路线选择分歧,核心在于对传感器能力上限、成本、以及系统长远发展的不同考量[5][6] 纯视觉方案的技术优势 - 摄像头提供的信息频率更高,每秒可达30帧,而激光雷达通常只有每秒10帧,视觉传感器在信息丰富度和获取频率上具有明显优势[7][11] - 视觉方案的能力上限更高,因其输入信息更丰富,对于需要快速博弈和迅速反应的场景处理能力更强[11] - 特斯拉的视觉处理能力达到每秒20多帧,而国内头部厂商基本在每秒10帧左右,显示出技术领先性[17] 融合感知方案的应用现状 - 激光雷达能让智驾系统快速实现量产上车,是目前一些厂商采用的“捷径”,但可能限制系统的长远性能天花板[6][10] - 在一些融合感知方案中,当不同传感器信息冲突时,智驾系统倾向于更相信激光雷达,这侧面反映了厂商视觉处理能力的不足[5][17] - 增加激光雷达线数(如从128线到800线)可以提高点云密度,改善对小物体的识别效果,但相应成本也会上升[18] 技术发展的核心挑战 - 充分利用摄像头海量信息的技术难点在于算法先进性以及在车端有限计算资源上的高效运行[9] - 传感器融合本身存在技术挑战,特别是当摄像头和激光雷达识别结果不一致时,如何决策成为难点[13][17] - 智驾系统的算力需求不仅取决于TOPS指标,还要考虑内存带宽、NPU对算子的支持力度等因素[10] 数据与算法的发展方向 - 行业趋势是从实际采集数据转向通过AIGC生成数据,这对于覆盖极限场景和危险场景尤为重要[18] - 产生有效数据的能力本质上是算法能力,而非单纯依靠大量采集数据,这可以大幅降低算力需求[19] - 特斯拉的成功在于坚持第一性原理,即使有挑战也坚持走正确的技术路线,把视觉AI能力作为核心[19] 成本与产品定义的平衡 - 汽车作为消费品需要考虑成本和价位差异,传感器选择需要综合性能、成本等多方面因素[7] - 激光雷达的采用不仅涉及价格因素,还包括车辆造型布置等工程考量[17] - 产品需要明确边界定义,如根据国家智能驾驶标准,视觉加4D毫米波雷达的方案能够解决多数问题,并不一定需要激光雷达[15]
Nullmax 徐雷:视觉能力将决定智驾系统上限,反对把激光雷达当 “拐棍”
晚点Auto· 2025-12-02 21:28
自动驾驶技术路线:纯视觉与融合感知 - 文章核心观点:自动驾驶领域存在纯视觉与融合感知的技术路线之争,但无论采用何种方案,都必须将视觉感知作为最核心、最优先发展的能力,视觉方案具有更高的性能上限[3][4][10] - 纯视觉方案的优势在于摄像头提供的信息更丰富、频率更高,摄像头帧率可达每秒30帧,而激光雷达通常只有每秒10帧[4][9] - 融合感知方案中,若过度依赖激光雷达而视觉处理能力不足,会限制系统的长远发展,当传感器信息冲突时,系统倾向于更相信激光雷达,这侧面印证了厂商视觉处理能力的不足[3][4][16] 传感器性能与技术难点 - 摄像头属于被动感知,能提供分辨率更高的图像、颜色和纹理特征等丰富信息,但关键在于如何充分利用这些海量信息[4][6] - 激光雷达能主动发射激光进行测距,但点云密度和分辨率较低,信息量少,观测间隔长达100毫秒,而摄像头每33毫秒就能提供800万像素的图像[4][9] - 充分利用摄像头的技术难点主要在于算法本身的技术先进性,以及如何在车端计算资源有限的嵌入式平台上高效运行[7] 成本、冗余与产品定义考量 - 传感器选择需要综合考虑性能、成本等多方面因素,汽车作为消费品需考虑成本和价位差异[5] - 激光雷达方案可能是个捷径,能快速让系统量产上车,但上限相对较低,增加激光雷达线数(如从128线到800线)可提升性能但成本也会上升[8][16] - 产品需要定义边界,例如在恶劣天气下是否行驶,根据国家智能驾驶标准,视觉加4D毫米波雷达的方案能够解决相关问题,并不一定要上激光雷达[11] 行业现状与领先者实践 - 特斯拉的视觉处理能力领先行业,其视觉处理帧率至少达到20多FPS,而国内头部厂商基本在10FPS左右[14] - 特斯拉坚持第一性原理,即使有挑战也坚持走正确的路,其选择在发展过程中先做好视觉,同时考虑到成本因素[10][17] - 数据使用方面,越往后通过AIGC生成数据更重要,因为对于极限场景,实际采集的数据有限,产生有效数据的能力本质上是算法能力[16][17]