自动驾驶之心 - 财报，业绩电话会，研报，新闻

自动驾驶之心

搜索文档

自动驾驶之心· 2025-11-05 08:04

自动驾驶技术路线分野 - 2025年成为自动驾驶技术架构的关键分水岭，形成WEWA与VLA两大对立技术路线 [2] - WEWA架构以华为乾崑智驾ADS 4为代表，追求“去语言化”实现高效落地 [2][4] - VLA架构以理想、小鹏等企业为代表，以语言模型为核心追求认知智能 [2][4] WEWA与VLA架构的本质区别 - WEWA核心逻辑为视觉直接映射动作，跳过语言转化环节，关键组件是云端世界引擎和车端世界动作模型 [5] - VLA核心逻辑为视觉-语言-动作三级传导，语言为核心中介，关键组件是视觉编码器加大语言模型加策略控制模块 [5] - WEWA技术核心是虚拟沙盘训练的端到端动作映射，代表指标为端到端时延降低50%，重刹率降低30% [5] - VLA技术核心是多模态对齐的语言化推理能力，优势在于复杂场景决策准确率提升和支持自然语言交互 [5] - WEWA通过云端虚拟沙盘预训练，将场景-动作映射固化到车端模型，实现“感知即决策”的高效闭环 [5] - VLA遵循“具身智能”认知逻辑，将视觉特征转化为语言Token进行语义推理，例如Wayve的LINGO-1模型能通过语言解释车辆决策 [6] VLA架构的算力挑战 - VLA训练阶段算力需求高，小鹏启动的720亿参数自动驾驶基座模型需千卡级GPU集群支持 [7] - VLA推理阶段即使使用7B-13B参数的轻量化语言模型，也需车规级高算力芯片（如Orin-X 200TOPS以上）保证实时响应 [7] - 语言模型的语义处理引入额外时延，使VLA端到端时延比WEWA高出近一倍，在毫秒级决策场景存在安全风险 [8] - VLA架构中语言模型持续运行会占用可观车端算力，可能导致感知模块帧率下降和传感器数据处理延迟 [9] VLA架构的语言模型优势 - 语言具有高度抽象能力，可将成千上万的类似场景压缩成一句话，实现巨量场景的压缩处理 [10] - 大语言模型具备跨场景知识迁移能力，能为自动驾驶注入“类人推理”能力，处理3000万个样本都无法覆盖的罕见场景 [12] - 语言作为通用语义载体，能将视觉信号、导航指令、人类语音等异构信息纳入同一推理框架，实现多模态信息统一表征 [13] - 语言模型能将抽象决策过程转化为自然语言输出，提升决策的可解释性与安全性，有助于L3及以上高阶自动驾驶商业化 [14] 技术路线的核心权衡与发展趋势 - 短期在L2-L3级辅助驾驶量产场景中，WEWA架构的低时延、低成本优势更具现实价值，通行效率可提升20% [15] - 长期在L4-L5级完全自动驾驶非结构化道路场景中，VLA的认知优势将不可替代，成为核心竞争力 [16] - 行业出现混合架构趋势，华为在WEWA中预留“语义接口”，小鹏通过“模型蒸馏”压缩大模型，取二者之长 [17] - 自动驾驶是否加入语言模块取决于语言模型的性价比，即抽象优势与算力开销的比值是否划算 [17] - 大语言模型是“高阶智能的催化剂”，在量产落地中WEWA更具效率优势，在完全自动驾驶目标中VLA的抽象能力是不可逾越阶段 [18]