强化学习大模型
搜索文档
Momenta曹旭东谈“R6强化学习大模型”:将超越人类驾驶水平
新浪财经· 2025-12-24 17:46
自动驾驶技术演进 - Momenta首席执行官曹旭东介绍,公司自动驾驶技术已进化至第六代,称为“强化学习的大模型” [1][4] - 第五代技术为模仿学习,通过模仿人类驾驶行为,其能力上限是接近或达到人类水平 [3][6] - 强化学习技术通过在实践中探索并接受奖励或惩罚,能够探索出更好的驾驶行为,有机会达到或超过人类驾驶水平 [3][6] 技术路径对比与优势 - 模仿学习被类比为从小学到大学均有老师指导的学习过程,但难以超越老师 [3][6] - 强化学习允许系统在云端训练环境中反复实践,通过海量试错优化驾驶策略,从而实现超越 [3][6] - 强化学习模型的目标是实现最安全、最高效的驾驶,掌握挑战场景下的最优驾驶策略 [3][6] 规模化数据与训练优势 - Momenta已实现超过50万台车的量产搭载 [3][6] - 据估算,1000万台车每年行驶里程可达千亿公里,而人类驾驶员一生仅能达到百万公里,这意味着自动驾驶系统可获得相当于10万倍的人类驾驶经验 [3][6] - 在云端训练环境中,系统可对同一场景进行高达10万次的训练,从最初的手忙脚乱,到训练1000次、1万次后变得熟练,最终在10万次训练后学会“直觉驾驶” [3][6]
“智驾普及元年”年终大考:奇瑞猎鹰智驾的承诺兑现了吗?
钛媒体APP· 2025-11-28 22:16
行业核心观点 - 2025年中国智能驾驶行业从“参数竞赛”迈入“落地验证”阶段,消费者关注点从“有没有”转向“好不好用”和“靠不靠谱” [3] - 行业面临“理想与现实”的鸿沟,存在功能交付“减配”、非结构化道路失误率高(是结构化道路的3-5倍)等核心痛点 [4][5] - 行业竞争正从“参数比拼”转向“场景落地能力比拼”,车企的“承诺兑现能力”成为新的核心竞争力 [20] 奇瑞猎鹰智驾系统落地 - 奇瑞汽车兑现年初承诺,猎鹰智驾辅助系统已于年内实现全品牌全系车型搭载 [3] - 该系统在广州“魔鬼路”实测中,于老城区、城中村、极端复杂停车场等极限路况表现稳定,验证了技术落地的真实性 [3][16] - 全系标配L2+级以上智驾解决方案体现了公司在技术成熟度、成本控制与供应链整合方面的综合能力 [3][20] 猎鹰智驾技术底座 - 系统构建了“数据闭环-算法突破-硬件冗余”三重技术底座 [7] - 数据方面:天穹智算中心积累超过240亿公里驾驶辅助场景数据,并通过“全球实车验证(年20亿公里)+数字仿真验证(2000万公里/天模型学习)”双重模式实现高效迭代,算法迭代周期缩短至每周一次 [7] - 星海大数据平台依托1800万+全球用户,每年新增1000万+高价值训练数据,结合180万+世界模型生成场景,形成“真实数据+合成数据”双重供给 [10] - 算法方面:搭载Momenta R6强化学习大模型,采用“世界模型+强化学习”机制和“感知-规划-执行”一栈式决策架构,实现“拟人化驾驶” [10][11] - 硬件方面:以风云A9L为例,配备激光雷达、800万双目摄像头、毫米波雷达等形成冗余感知,联合算力达16Eflops,采用“算法优化+算力合理分配”的“够用即优”策略 [12][14] 奇瑞的智能化战略路径 - 公司拥有15年智能化技术积累,是中国最早布局智能化的车企之一,构建了覆盖智舱、智驾等全领域的千人研发体系 [17][19] - 采取“自主研发+开放合作”生态模式,与华为、Momenta、地平线等企业进行深度技术协同,而非简单供应商采购 [19] - 规模化落地策略旨在通过海量用户数据反哺系统迭代,形成“落地-数据-迭代-再落地”的良性循环 [19] - 根据规划,公司计划在2026年实现融合式端到端(VLA+WM),具备未来场景推理能力 [21]