Workflow
理想正在掀起智能驾驶的iPhone 4时刻
理想汽车理想汽车(US:LI) 投资界·2025-03-19 17:35

核心观点 - 理想汽车自研VLA模型MindVLA将重新定义自动驾驶,带来类似iPhone 4的颠覆性技术变革 [2] - MindVLA计划于2024年与首款纯电SUV理想i8同步发布 [2] - 2025年将成为自动驾驶元年,MindVLA将重构人车关系,推动汽车从工具进化为"空间机器人" [18][19] 技术架构 - MindVLA基于端到端+VLM双系统架构,深度融合空间、语言及行为智能 [4] - 采用3D高斯作为中间表征,提升3D几何表达能力与下游任务性能 [8] - 所有模块均为全新设计,包括3D空间编码器、Action Token生成及Diffusion轨迹优化 [6] 关键技术突破 - 自研LLM基座模型采用MoE架构与Sparse Attention,平衡参数规模与推理效率 [10] - 通过3D数据训练、未来帧预测及稠密深度预测任务强化空间智能 [10] - 创新应用并行解码技术和投机推理,优化NVIDIA Drive AGX的实时性能 [10] - 采用ODE采样器将Diffusion轨迹生成步骤压缩至2-3步,提升效率 [10] - 通过RLHF微调对齐人类驾驶行为,显著提升安全下限 [10] 世界模型与训练 - 自研重建+生成云端统一世界模型,构建高真实度仿真环境 [12] - 实现大规模闭环强化学习,3D GS训练速度提升7倍以上 [12] - 预训练与后训练方法使模型具备跨场景泛化能力(如室内环境) [14] 用户体验重塑 - "听得懂":支持自然语音指令交互(如路线调整、目的地搜索) [16] - "看得见":具备通识能力识别商业标识,通过照片定位车辆 [18] - "找得到":自主完成地库漫游、车位寻找及复杂场景泊车 [18] - 车辆可理解"开快/慢点"等指令,实现无地图依赖的空间推理 [18][19] 行业影响 - 公司定位从技术领跑者转向规则制定者,推动AI定义出行方式 [19] - 技术实现物理世界与数字世界融合,拓展空间应用边界 [19]