认知驱动下的小米智驾，从端到端、世界模型再到VLA......

小米汽车智能驾驶技术发展 - 智能驾驶能力发展遵循三个阶段：从1.0规则驱动到2.0数据驱动再到3.0认知驱动[7] - 技术发展路线为：2024年3月高精地图版本高速NOA → 2024年5月城区NOA → 2024年10月轻图和无图版本 → 2025年2月300万clips端到端版本 → 2025年7月1000万clips版本 → 近期世界模型版本[7] - 在安全、舒适和效率三个维度上，安全永远是第一位[4] - 泊车功能渗透率最高且用户使用最多，城区智驾投入最大且提升空间最大[8] - 2024年11月21日广州车展发布Xiaomi HAD增强版，将通过OTA冬季大版本Xiaomi HyperOS 1.11系列推送给用户[8] 世界模型技术特性 - 世界模型三大核心特性：生成的多样性（重建真实性+快速新场景生成+场景编辑）、多模态输入输出（文字/视频输入+视觉/LiDAR重建）、交互能力（闭环影响下一时刻自车行为）[9] - 世界模型更偏云端应用，通过数据生成、闭环仿真和强化学习提升模型性能，不直接参与车端Action输出[10] - 1.11版本引入世界模型和强化学习，主要解决极端corner case场景，采用重建+生成结合方式[8] VLA与端到端技术路线 - VLA（视觉语言动作模型）是认知驱动核心，为下一阶段量产目标，并非端到端的升级[7] - 端到端本质是模仿学习，VLA直接将大模型能力赋予自动驾驶，世界模型类似端到端plus[13] - VLA可与世界模型融合，学习人类高层次知识（交通规则/价值观）[13] - 小米大模型发展路线：LLM预训练 → VLM预训练 → 具身预训练 → 自驾VLA，已推出MiMo、MiMo-vl和MiMo-Embodied[13] - VLA的无损传递是相比端到端+VLM的最大提升[13] 自动驾驶技术社区资源 - 自动驾驶之心知识星球涵盖40+技术方向，包括VLA学习路线、端到端自动驾驶、世界模型等[16][27] - 社区成员来自300家机构与自驾公司，包括蔚小理、地平线、华为等头部企业[26] - 提供近40+开源项目、近60+数据集、行业主流仿真平台及各类技术学习路线[27] - 社区内部举办超过100场专业技术直播，邀请学术界和工业界大佬分享最新研究成果[99]