VLA技术架构潜力 - VLA架构源于机器人与具身智能,具备长期技术潜力,可支持城区自动驾驶,延续至机器人繁荣后才可能被替代 [1] - 语言理解能力(L)是核心能力提升,增强思维链(CoT)处理复杂场景,非锦上添花而是必要能力 [4] - 泛化能力通过强化学习形成自主思考,无需依赖数据输入即可处理新场景 [5] 硬件性能与部署 - Thor-U芯片支持FP4精度,算力达1400(FP8为700),推理帧率可从10Hz提升至20-30Hz [2] - 双Orin平台与Thor平台功能同步,模型部署无差别,内部持续优化帧率 [2] - 3.2B MoE车端模型升级周期分基座预训练(按月更新)与后训练(按需调整),流匹配技术实现2-3步快速去噪,时延仅15毫秒 [6][7] 技术路线与差异化 - 暂不自研芯片以保持架构通用性,待模型定型后再评估可能性 [3] - VLA通过强化学习实现个性化驾驶风格,FaceID切换不同用户偏好,形成产品差异化 [19][22] - 与特斯拉技术栈目标一致,但更注重全场景能力逐步迭代,Robotaxi路线需谨慎研发 [17] 功能实现与迭代 - 行车、泊车、AEB已一体化训练,当前版本集成全部模块 [17] - 地库车速从10公里提升至15公里,未来继续优化上限 [10] - 远程召唤时可查看车辆周围影像,功能已实现 [13] 安全与合规性 - AEB作为安全兜底机制,帧率高且独立于VLA运行 [21] - 当前版本调优偏稳妥合规,如虚线借道超车需明确指令 [9] - 目标2024年底MPI(平均接管间隔)达400-500公里,2025年突破千公里 [18] 法规与商业化 - 参与L4法规建设,技术能力可支持但需政策落地 [18] - 后台监控未来由AI接管,现阶段人力仅为展示保护 [16] - 驾驶风格适配从早期用户向大众普及,依赖信任感建立 [12]
关于理想VLA的22个QA