Nullmax 徐雷:视觉能力将决定智驾系统上限,反对把激光雷达当 “拐棍”
特斯拉特斯拉(US:TSLA) 晚点Auto·2025-12-02 21:28

自动驾驶技术路线:纯视觉与融合感知 - 文章核心观点:自动驾驶领域存在纯视觉与融合感知的技术路线之争,但无论采用何种方案,都必须将视觉感知作为最核心、最优先发展的能力,视觉方案具有更高的性能上限[3][4][10] - 纯视觉方案的优势在于摄像头提供的信息更丰富、频率更高,摄像头帧率可达每秒30帧,而激光雷达通常只有每秒10帧[4][9] - 融合感知方案中,若过度依赖激光雷达而视觉处理能力不足,会限制系统的长远发展,当传感器信息冲突时,系统倾向于更相信激光雷达,这侧面印证了厂商视觉处理能力的不足[3][4][16] 传感器性能与技术难点 - 摄像头属于被动感知,能提供分辨率更高的图像、颜色和纹理特征等丰富信息,但关键在于如何充分利用这些海量信息[4][6] - 激光雷达能主动发射激光进行测距,但点云密度和分辨率较低,信息量少,观测间隔长达100毫秒,而摄像头每33毫秒就能提供800万像素的图像[4][9] - 充分利用摄像头的技术难点主要在于算法本身的技术先进性,以及如何在车端计算资源有限的嵌入式平台上高效运行[7] 成本、冗余与产品定义考量 - 传感器选择需要综合考虑性能、成本等多方面因素,汽车作为消费品需考虑成本和价位差异[5] - 激光雷达方案可能是个捷径,能快速让系统量产上车,但上限相对较低,增加激光雷达线数(如从128线到800线)可提升性能但成本也会上升[8][16] - 产品需要定义边界,例如在恶劣天气下是否行驶,根据国家智能驾驶标准,视觉加4D毫米波雷达的方案能够解决相关问题,并不一定要上激光雷达[11] 行业现状与领先者实践 - 特斯拉的视觉处理能力领先行业,其视觉处理帧率至少达到20多FPS,而国内头部厂商基本在10FPS左右[14] - 特斯拉坚持第一性原理,即使有挑战也坚持走正确的路,其选择在发展过程中先做好视觉,同时考虑到成本因素[10][17] - 数据使用方面,越往后通过AIGC生成数据更重要,因为对于极限场景,实际采集的数据有限,产生有效数据的能力本质上是算法能力[16][17]