多传感器融合方案

搜索文档
智能辅助驾驶下半场,“第一性原理”失灵了吗?
36氪· 2025-06-20 10:57
智能辅助驾驶技术路线 - 特斯拉坚持纯视觉方案的理论基础是全球道路交通体系本质围绕视觉感知能力构建 人工智能结合数字神经网络和摄像头是与现有道路系统最匹配的解决方案 [1] - 马斯克批评激光雷达技术 认为道路系统并非为从眼睛发射激光而设计 摄像头与激光雷达同时工作可能导致信息冲突和交通事故 [3] - 纯视觉方案最大优点是成本较低且贴近人眼逻辑 通过对摄像头持续优化可无限接近人类眼睛 [20] 第一性原理 - 第一性原理是系统中最基本的命题或假设 不能被违背或删除 核心思想是回归事物本质 剖析最基本原理构建新认知框架 [3] - 智能辅助驾驶的第一性原理应聚焦本质需求 以标准化能力推动普惠价值 实现从A点到B点的安全 舒适 高效 [4] - 手机行业演进史为汽车智能化提供启示 基带芯片以"稳定传输"为第一性原理 智能辅助驾驶应成为像基带一样可靠的基础设施 [4] 特斯拉技术发展历程 - 2014-2016年外部合作期 采用Mobileye EyeQ3芯片 算力0.25 TOPS 支持1个前视摄像头 1个毫米波雷达和12个超声波雷达 [6] - 2016-2019年自研过渡期 转向英伟达方案 算力10 TOPS 配备8个摄像头 1个毫米波雷达 12个超声波雷达 同时开始自研FSD芯片 [7] - 2019年进入全面自研期 推出HW3.0 配备两颗自研FSD芯片 算力144 TOPS 相比前代增长7倍多 [7][9] 特斯拉技术方案演进 - 引入BEV+Transformer算法栈 让视觉感知网络获得测速 测距能力 将2D画面拼接成360度全景俯视图 [13] - 升级占用网络 将车辆周围空间划分成小方格标记是否被物体占据 实现高分辨率三维感知与重建 [14] - 推出端到端方案 完全采用一张神经网络链接感知 规控和执行 2023年测试中运行速度比原方案更快 删除30万行人工代码 [16][17] 技术方案对比 - 纯视觉方案在信息丰富度 三维深度 测距精度 相对场景可靠性等方面弱于多传感器融合方案 但成本更低 [19] - 激光雷达在探测距离 精度和实时性方面有明显优势 但易受天气影响 可能发生多次反射导致信号失真 [20][21] - 多传感器融合方案需承担更高硬件成本 开发能融合多传感器数据的算法 并采用高算力芯片处理数据 [23]
纯视觉向左融合感知向右,智能辅助驾驶技术博弈升级
36氪· 2025-05-22 11:35
特斯拉纯视觉方案 - 公司坚持视觉处理方案,目标是让人人买得起安全智能的产品[1] - 即将推出基于纯AI技术的通用型全自动驾驶(FSD)解决方案,延续2016年以来的视觉优先战略,完全抛弃激光雷达[1] - 方案仅依靠摄像头和自研芯片实现L4-L5级自动驾驶,连毫米波雷达也已弃用[4] - 视觉方案搭配端到端神经网络架构,通过数十亿真实世界数据样本训练,实现多场景安全驾驶[4] - 公司认为先进技术不需要昂贵繁杂的传感器,纯视觉最贴近人类驾驶习惯,是自动驾驶的"第一性原理"[4] 激光雷达市场发展 - 全球乘用车激光雷达市场2024年同比增长68%,规模达6.92亿美元[1] - 中国激光雷达配置车型达94款,相比上一年度翻倍[1] - 激光雷达成本8年内降低99.5%,从数千美元降至200美元左右[1] - 行业认为激光雷达正从"可选功能件"进化为"必选安全件"[1] - 2024年高阶智能辅助驾驶进入20万元以内市场,激光雷达上车趋势明显[19] 技术路线对比 纯视觉方案 - 依靠摄像头捕捉RGB图像数据,通过深度学习算法提取语义特征[6] - 最大优势是硬件成本低、系统集成简单,但依赖算法处理能力[6] - 在恶劣天气和复杂光照条件下可靠性面临挑战[6] - 需要处理大量图像数据,对系统算力和能耗要求高[6] 多传感器融合方案 - 结合激光雷达、摄像头、毫米波雷达等多种传感器[8] - 激光雷达测距精度达厘米级,不受光照影响[11][12] - 摄像头提供丰富语义信息但受环境影响大[11][12] - 毫米波雷达在恶劣天气表现稳定但分辨率低[11][12] - 多传感器融合可弥补单一传感器缺陷,提升系统鲁棒性[17] 市场应用差异 - 特斯拉FSD在北美渗透率超30%,但可能低估中国路况复杂性[7] - 中国车企针对"鬼探头""加塞"等本土场景开发针对性解决方案[7] - 理想汽车CEO表示激光雷达在中国路况下可实现130公里/小时AEB功能,比纯视觉方案探测距离更远[16] - 华为、理想等企业认为L3/L4级自动驾驶必须配备激光雷达[13] 行业发展趋势 - 技术路线本质是"算法驱动"与"硬件驱动"的理念之争[16] - 特斯拉通过海量数据训练全能算法,国内车企通过硬件堆砌安全冗余[16] - 行业正从"单车智能"向"系统智能"演进,结合V2X实现协同控制[19] - 智能辅助驾驶进入规模化普及阶段,安全是行业不可逾越的底线[20]
从“能动”到“灵动”,机器人智能化步入新篇章
2025-05-12 09:48
纪要涉及的行业或公司 - **行业**:机器人行业,尤其是人形机器人领域 - **公司**:志远公司、优必选、英伟达、特斯拉、DRECOM、全志、瑞芯微、黑芝麻智能 纪要提到的核心观点和论据 - **技术发展现状**:过去两到三年人形机器人领域技术进步显著,国内优必选等公司在运动能力方面表现突出,能在预设环境完成固定动作达产业推广阶段,但智能化水平未达灵动阶段,如无法完成拿起水杯喝水等细节复杂动作,需与AI和自动化系统结合[2] - **视觉传感方案差异**:海外特斯拉采用纯视觉方案降低硬件成本但对大模型算力要求高,国内因算力限制和传感器供应链优势,预计未来以激光雷达加3D视觉传感器等多传感器融合方案为主[3][10] - **应用前景和商业化进展**:潜在需求覆盖工业制造、物流配送等场景,可弥补劳动力短缺和替代危险工作,目前商业化处于早期,工业场景应用集中在搬运等标准化流程,预计在流程标准化且人力成本高的场景率先落地[1][4] - **商业化面临困难**:硬件方面执行器、传感器精度等需提升,续航短成本高;软件方面人机交互效率低,多模态感知准确性偏低等,导致难以准确理解任务指令和调整行动规划,提高智能水平是关键[1][5] - **解决训练数据集匮乏方案**:增加真实数据采集,如志远公司搭建模拟生活空间,北京、上海等地建创新中心;采用物理仿真方法,如英伟达提供的方法,旨在提高训练数据质量,加速商业应用拓展[1][6][7] - **仿真技术提高数据获取效率**:调整场景参数或变化场景,可基于少量真实数据衍生大量训练数据,提高效率降低成本,但仿真结果与真实世界有偏差,需真实数据校正,未来主流是结合真实与仿真数据采集[8] - **机器人基座大模型发展趋势**:呈现多系统架构趋势,如NVIDIA的Grace Hopper等,未来需解决多模态和泛化能力问题,以适应复杂环境和提高运动技能学习效率[1][9] - **力学和触觉传感发展方向**:朝着更精准的感知及执行方向发展,六维力传感器及电子皮肤是未来方向,实现实时控制需高效机械通信协议及强大算力硬件支撑[11] - **EtherCAT协议优势**:采用分布式架构设计,将通信延迟控制在微秒级别,优于CAN总线协议和其他实时工业以太网协议,有望成机器人主流通信协议[3][12] - **端侧芯片应用现状**:机器人大脑大模型芯片主要有英伟达Orin和特斯拉自研芯片,小脑任务对算力需求低,国产芯片已应用于部分机器人,端侧算力需求预计持续增长,国产芯片性能提升带来机遇[13] 其他重要但是可能被忽略的内容 - DRECOM即将发布NPU与DMC堆叠封装新产品,适合端侧运行大模型,专门定制化硬件预计2025年或2026年进入市场,一级市场股权投资向自动化方向转移[14]