Workflow
BEV表征
icon
搜索文档
轻舟智航L2/L4智驾方案解析:一段式、VLA和世界模型
自动驾驶之心· 2026-01-26 15:16
轻舟智航技术方案与产品进展 - 公司首个基于单颗地平线征程6M芯片的城市NOA方案已于21号正式上车理想L系列智能焕新版[2] - 该方案在23号的发布会上进行了技术分享[2] 基于单J6M的端到端自动驾驶架构 - 技术方案采用单征程6M芯片实现了一段式端到端架构并结合了强化学习[3] - 核心网络架构的输入部分包括时序图像、激光雷达、SD导航和自车位姿信息[6] - 经过多传感器时序BEV融合后,得到全局的BEV表征[6] - 后续通过多任务解码头输出道路拓扑、OCC特征、交通元素特征和智能体特征[6] - 这些特征用于获取动静态信息、OCC和交通信号灯等[6] - BEV表征与上述特征共同输入到一个统一的世界-状态隐编码器[7] - 之后连接一个Flow-Matching规划器,用于解码他车运动预测并生成多模态的自车轨迹[7] - 后续利用Safe RL进一步优化自车轨迹,该步骤增加了规则判断[5] - 整套架构的挑战在于在J6M芯片128TOPS的有限算力上实现[5] - 采用的DiffusionDrive和Flow Matching算法已被多家公司验证为可量产算法[5] - Flow规划器是Diffusion规划器的改进版本,源自清华AIR詹仙园老师团队的工作[5] 实车演示表现 - 公司展示了L2级别实车在困难场景下的表现,包括严重错位道路和复杂路口的无保护左转,效果良好[5] - 严重错位道路场景对静态感知基本功要求高,不仅考验道路/车道线识别,也考验SD地图接入模型的表现[5] - 公司也展示了L4级别实车的表现[9] 下一代自动驾驶模型架构展望 - 公司提出了下一代自动驾驶模型架构,其核心理念是将视觉语言动作模型与世界模型融合到一个端到端系统中[11] - 若去掉Transformer解码器和语言推理模块,该架构仍可理解为一段式端到端,整体与小鹏的VLA 2.0有些相似[11] - 架构中同样包含通过强化学习微调自车轨迹的步骤,该判断模块是为端到端系统提供安全保障的兜底模块[12] - 针对L4级自动驾驶,公司提出了RA机制以保障系统级安全,在此意义上,VLA被视为L4系统规模化运行的基础设施而不仅是能力展示[12] - 根据架构图,下一代系统输入可能增加用于交互的语音指令[17] - 世界编码器可能仍基于BEV特征,可直接解码得到动静态/OCC/交通控制信息[17] - 增加了Transformer解码器,用于处理环境复杂文本、困难场景描述和车端语言指令,并作为思维链的中间表示[17] - 增加了多模态世界解码器,作为具备未来世界动态演化能力的生成式世界预测模型[17] - 多模态世界解码器与语言推理模块需要强交互并对齐,这是VLA的核心,否则会产生严重幻觉[17] 公司高层观点 - 公司联合创始人兼CEO于骞判断,无论是VLA还是世界模型,都不会是自动驾驶技术的终极答案[13]