Workflow
端到端自动驾驶技术
icon
搜索文档
11月车市基本符合预期,英伟达开源VLA模型
财通证券· 2025-12-11 21:00
核心观点 - 报告认为2025年11月中国乘用车市场销量基本符合年初“前低中高后平”的走势,尽管当月同比下滑,但总体走势正常,主要受高基数及补贴政策调整影响 [5] - 报告指出,英伟达首次开源视觉-语言-动作模型,标志着端到端自动驾驶技术进入具备“因果思考”的新阶段,是智能驾驶领域的重要事件 [6] - 报告建议关注在汽车智能化领域具有优势地位且软件能力领先的一系列公司 [8] 11月车市销量分析 - 2025年11月全国乘用车市场零售222.5万辆,同比下降8.1%,环比下降1.1% [5][11] - 2025年1-11月累计零售2,148.3万辆,同比增长6.1% [5][11] - 今年零售累计增速呈现阶段性变化:1-2月增长1.2%,3-6月增长15%,7-9月增速徘徊在6%左右,10-11月回落到偏低状态 [5][11] - 截至10月22日,2025年汽车以旧换新补贴申请量突破千万辆,前11个月申请量已达1,120万辆 [5][11] - 随着各地补贴大面积暂停,11月日均补贴规模降至3万辆,增速调节效果明显 [5][11] - 11月乘用车厂商生产、出口、批发均创当月历史新高,出口创出历年各月历史新高 [16] - 11月新能源车国内零售渗透率达59.3% [16] - 2025年1-11月,自主新能源出口178万辆,同比增长139%,新能源占自主出口比例达40.6% [16] 市场结构与品牌表现 - **分车型**:11月轿车零售100.7万辆,SUV零售113.2万辆,MPV零售8.6万辆 [12] - **分动力类型**:11月纯电动车零售82.7万辆,同比增长9.2%;插电混动车零售37.8万辆,同比下降2.8%;增程式电动车零售11.6万辆,同比下降4.3% [17] - **分品牌阵营**: - 自主品牌:11月零售149万辆,同比下降4%,国内零售份额为67%,同比增长3个百分点 [19] - 主流合资品牌:11月零售49万辆,同比下降19% [19] - 豪华车:11月零售24万辆,同比下降7%,环比增长31% [19] - 韩系、法系品牌零售同比分别增长13%和6%,成为增长亮点 [16] 库存与市场情绪 - 2025年11月中国汽车经销商库存预警指数为55.6%,同比上升3.8个百分点,环比上升3.0个百分点,位于荣枯线之上 [20][23] - 调查显示高达80%的经销商对11月市场持悲观态度,认为整体表现未达预期 [20] 汽车智能化动态 - **智能化指数**:2025年10月乘用车智能化指数为35.9,较上月环比下降0.2个单位,主要受整体市场增速放缓及特斯拉销量环比下降64%等因素拖累 [24][26] - **OTA升级情况**: - 10月新势力品牌中仅零跑、特斯拉、乐道3家进行了OTA升级推送 [25] - 10月自主品牌中共有15个品牌推送了OTA升级,比亚迪系品牌推送版本及功能数量位居前列 [25] - 合资品牌OTA呈现试水“高阶智驾”特征,如宝骏新增“绿波引导”、日产推送“城市记忆领航辅助驾驶”等功能 [29] - **行业重要事件**: - 英伟达于12月开源全新的视觉-语言-动作模型Alpamayo-R1,并上传了约100TB的相关数据集 [6][33] - 滴滴自动驾驶完成20亿元D轮融资 [6] - 端侧AI芯片公司曦华科技正式向港交所递交IPO申请,其2022年至2024年营业收入从8,667.9万元增长至2.44亿元,年复合增长率达67.8% [7][35] 投资建议 - 报告建议关注锐明技术、道通科技、黑芝麻智能、地平线、华测导航、德赛西威、均胜电子、虹软科技、中科创达、经纬恒润、慧翰股份、鸿泉物联、博实结等在汽车智能化中具有优势地位且软件能力领先的公司 [8][39]
英伟达把自动驾驶核心技术公开了,吴新宙牵头研发,VLA大模型和海量数据免费用
36氪· 2025-12-03 18:52
英伟达开源VLA自动驾驶模型Alpamayo-R1 - 英伟达研究团队正式发布并开源全新的视觉-语言-动作模型Alpamayo-R1,并计划在未来的更新中开源该模型的部分核心数据集 [1] - 这是英伟达首次将VLA模型进行开源,对应的数据集已上传至开源社区,总大小约100TB,数据许可明确可用于商业和非商业用途 [2] - 此举打破了高端自动驾驶模型的封闭高墙,标志着端到端自动驾驶技术从“模仿行为”迈向了具备深层“因果思考”的新阶段 [4] 模型性能与测试结果 - 在针对极高难度长尾场景的测试中,AR1的规划准确率相比仅有轨迹预测的基线模型提升了12% [5] - 在闭环仿真测试里,AR1成功将车辆冲出道路的事故率降低了35% [5] - 与其他车辆或行人的近距离危险遭遇率大幅减少了25% [5] - 该模型在NVIDIA RTX 6000 Pro Blackwell车载硬件上保持了99毫秒的端到端超低延迟,满足实时自动驾驶需求 [5] - 具体测试数据显示,AR1的越野率从基线模型的17.0%±3.0%降至11.0%±2.0%,近距离遭遇率从4.0%±3.0%降至3.0%±2.0%,AlpaSim得分从0.38±0.04提升至0.50±0.08 [5] 技术架构与创新 - 为解决传统端到端模型的“黑盒”问题,研究团队构建了全新的“因果链”数据集,核心在于教会模型建立“观察-原因-决策”的严密逻辑闭环 [7][12] - Alpamayo-R1采用模块化高效架构,由专为物理AI打造的Cosmos-Reason视觉语言模型负责环境理解和逻辑推理,由基于流匹配技术的动作专家解码器控制行动 [13] - 在训练阶段引入了强化学习机制,利用更大规模的推理模型作为批评者对AR1的表现进行打分,重点要求模型推理逻辑与实际驾驶动作一致 [13][15] - 采用强化学习新模式后,模型的推理质量提升了45%,推理与行动的一致性提高了37% [17] - 训练策略表格显示,结合推理、一致性和安全性的强化学习策略,将近距离遭遇率从6.9%降至3.7%,推理-动作一致性得分从0.62提升至0.83 [16] 行业影响与战略意义 - VLA模型将“世界知识”引入驾驶舱的能力,是突破L4级自动驾驶长尾难题的公认解决方案之一 [8] - VLA研发对算力、算法、数据集要求极高,此前仅有小鹏、理想、小米、元戎启行等头部企业在推动VLA上车,开源项目也较少 [10] - 英伟达通过开源AR1及数据集,向全行业提供了一套L4级自动驾驶的“参考答案”,有效降低了中小厂商和研究机构的入场门槛,可能催生一批基于AR1微调的方案 [19] - 此举是英伟达“软硬一体”战略的体现,AR1展现的强大性能依赖于英伟达强大的GPU算力和配套的Cosmos框架工具链,通过定义先进的软件范式来锁定未来的硬件市场 [19] - 该项目由英伟达自动驾驶负责人吴新宙全面负责,他曾任小鹏汽车自动驾驶副总裁,于2023年8月加入英伟达并直接向CEO黄仁勋汇报 [18]
清华最新SOTA!ArbiViewGen:自监督框架实现多车型任意视角可控图像生成~
自动驾驶之心· 2025-08-11 07:32
核心观点 - 提出ArbiViewGen框架,用于自动驾驶场景中任意视角图像生成,解决外推视角缺乏真实数据的问题 [4][9] - 采用特征感知自适应视角拼接(FAVS)和跨视角一致性自监督学习(CVC-SSL)两大核心模块 [9][10] - 在nuScenes数据集上验证,性能优于基线方法,PSNR达14.2335,SSIM达0.9691 [14][15] 研究动机与贡献 - 自动驾驶行业面临多源传感器系统异构配置带来的数据复用挑战 [5] - 现有方法依赖目标视角真实监督,难以适应自动驾驶场景非结构化数据分布 [6] - 首次实现多种车辆异构配置中可控任意视角相机图像生成 [4] 方法总览 - FAVS模块通过分层优化策略实现六相机图像到任意目标视角的高质量拼接 [9] - CVC-SSL模块基于潜在扩散模型,引入几何引导跨视角注意力机制 [10] - 仅需多相机图像及其姿态信息,无需额外传感器或深度图 [3] 技术细节 - FAVS包含几何变换建立、特征匹配优化、目标对齐微调、自适应融合生成四阶段 [9] - CVC-SSL通过循环重建自监督范式克服新颖视角缺乏监督的问题 [13] - 提出图像质量评估策略,投影彩色点云建立定量评估框架 [13] 实验结果 - 定量指标全面优于基线:PSNR提升48.8%(9.5647→14.2335),MAE降低47.2%(72.4672→38.2820)[14] - 消融实验显示FAVS和CVC-SSL分别带来27.4%和19.9%的PSNR提升 [15] - 可视化结果展示更好的结构一致性和空间完整性 [18] 应用前景 - 增强自动驾驶系统在不同传感器配置中的适应性和鲁棒性 [23] - 促进跨平台部署和可扩展数据重用,降低开发成本 [5][23] - 未来将整合激光雷达深度先验和语义一致性约束以提升质量 [23]