Autonomous Driving
搜索文档
TIER IV to develop large-scale dataset for autonomous driving under NEDO project
Prnewswire· 2025-12-26 12:00
项目与政府支持 - TIER IV公司被日本政府的新能源与产业技术综合开发机构选中 参与一项旨在通过开发综合性AI数据平台和生态系统来增强产业竞争力的计划[1] - 该项目旨在提升日本在自动驾驶领域的竞争力 并加速安全高效自动驾驶系统的部署[2] 项目核心内容与技术方案 - 项目将专注于三大领域:大规模驾驶数据收集、利用AI生成合成数据、以及AI数据基础设施与生态系统开发[5] - 大规模驾驶数据收集:将使用多种车型收集多样化驾驶数据 并开发提高数据构建效率的技术 如自动化标注[5] - 合成数据生成:开发与多种传感器兼容的多模态生成式AI模型 以创建覆盖罕见场景的高质量训练数据 例如事故发生前瞬间以及多样的天气和时间条件[5] - AI数据平台开发:创建一个平台 使日本的自动驾驶开发者能够访问高质量数据[5] 公司战略与行业背景 - TIER IV是深度科技创新的前沿公司 开创了全球首个自动驾驶开源软件Autoware[3] - 公司利用Autoware构建可扩展的平台 并在软件开发、车辆制造和服务运营方面提供全面解决方案[3] - 作为Autoware基金会的创始成员 公司致力于通过开源软件重塑智能汽车的未来[3] - 端到端AI在自动驾驶领域日益受到关注 其发展依赖于海量且多样化的驾驶数据[2] - 收集现实世界中罕见场景的数据既耗时又成本高昂[2] 项目目标与预期影响 - 通过该项目 TIER IV将收集大规模真实世界驾驶数据 并利用多模态AI生成合成数据 以覆盖现实世界中难以捕捉的场景[1] - 结合这些努力 公司旨在为自动驾驶AI创建先进的数据集[1] - 项目旨在提升公司的数据集能力 同时促进创建一个能减轻单个公司开发负担的AI数据平台[2]
刷新NAVSIM SOTA!端到端自动驾驶新框架Masked Diffusion
自动驾驶之心· 2025-12-26 11:32
行业技术范式转移 - 端到端自动驾驶正经历从模块化向大一统的范式转移,VLA模型兴起[3] - 主流自回归生成范式存在局限性,其强制遵循的从左到时序生成逻辑与人类驾驶员以终为始的思维直觉存在本质差异[3] - 基于模仿学习的模型容易陷入平均司机陷阱,倾向于拟合数据分布均值,导致策略平庸化,难以在激进与保守间灵活切换[3] 核心技术创新:WAM-Diff框架 - 复旦大学与引望智能联合提出WAM-Diff框架,将离散掩码扩散模型引入VLA自动驾驶规划[3] - 框架结合稀疏混合专家架构与在线强化学习,构建了一套不受限于单向时序的生成式规划系统[3] - 在NAVSIM-v1和v2榜单上分别取得91.0 PDMS和89.7 EPDMS的SOTA成绩,证明了非自回归范式的潜力[4] 技术细节:生成逻辑与架构 - 采用混合离散动作分词技术,将连续2D轨迹坐标量化为高精度离散Token,误差控制在0.005以内,并与语义Token置于共享词表[6] - 使用Masked Diffusion作为生成骨干,从全掩码序列出发,利用双向上下文信息并行预测所有位置Token,提升推理效率与全局优化能力[6] - 探索因果序、反因果序和随机序三种解码策略,实验发现反因果序策略在闭环指标上表现最佳,验证了以终为始生成逻辑的有效性[9] 模型架构增强 - 集成LoRA-MoE架构,包含64个轻量级专家,通过门控网络实现动态路由与稀疏激活,根据场景自动激活最匹配的驾驶专家[12] - 采用多任务联合训练,使模型在学习轨迹预测的同时通过驾驶VQA任务理解场景语义,增强规划的可解释性与泛化能力[12] - 引入分组序列策略优化算法,将优化粒度从单步Token提升至完整轨迹序列,依据安全性、合规性及舒适性等多维指标对整条轨迹进行评分[14] 性能表现与实验验证 - 在NAVSIM-v1评测中,WAM-Diff达到91.0的PDMS分数,超越DiffusionDrive、ReCogDrive及DriveVLA-W0等基线模型[16][17] - 在NAVSIM-v2评测中,取得89.7的EPDMS成绩,相较于DiffusionDrive提升了5.2分,表明其能有效平衡安全性与合规性[18][19] - 消融研究表明,反因果序解码策略取得最佳闭环性能,PDMS为91.0,支持以终为始的规划直觉[20][21] - 定性实验验证了MoE架构与GSPO在线强化学习在提升长尾场景鲁棒性方面的作用[22] 行业意义与展望 - WAM-Diff标志着端到端自动驾驶规划向离散化、结构化、闭环化迈出重要一步[26] - 该研究证明在VLA时代,如何生成与生成什么同样重要,具备反向推理能力的规划器可能是通往L4级自动驾驶的关键拼图[26]
TIER IV forms capital and business alliance with JR Central to support regional development through rail and autonomous driving integration
Prnewswire· 2025-12-26 09:00
公司与战略联盟 - TIER IV与日本东海旅客铁道公司宣布建立资本与业务联盟[1] - 联盟旨在深化合作并推进开发下一代“第一及最后一英里”出行解决方案以改善火车站接驳[1] - 该联盟将建立一个未来扩展“第一及最后一英里”出行服务的框架[3] 合作背景与行业挑战 - 日本正面临因人口下降和专业司机短缺而日益紧迫的出行挑战[2] - 自动驾驶巴士和接驳车有望改善火车站的可达性从而有助于维持铁路服务的使用[2] - 自动驾驶系统作为扩大出行选择和支援地区社区的方式正受到关注[4] 技术基础与部署 - TIER IV利用其开源自动驾驶软件Autoware已将自动驾驶技术部署于包括乘用车、出租车和巴士在内的多种车辆[3] - Autoware是全球首个用于自动驾驶的开源软件[5] - 公司致力于通过开源软件重塑智能汽车的未来[5] 合作目标与愿景 - 合作旨在加速自动驾驶部署并通过改善“第一及最后一英里”的连通性来振兴日本东海旅客铁道公司铁路沿线的社区[4] - 展望未来与中央新干线(Linear Chuo Shinkansen)的整合双方将共同创造新的出行价值[4] - 自动驾驶技术在服务区域内具有维持和增强车站可达性的巨大潜力并最终通过与即将到来的中央新干线整合创造新的人流与交流[4] - 日本东海旅客铁道公司通过对TIER IV投资及与自动驾驶部署领导者合作旨在深化协作并与当地社区一起进一步提升所服务地区的价值[4] 公司定位 - TIER IV是深度科技创新的前沿力量是Autoware的先驱者[5] - 公司利用Autoware构建可扩展的平台并在软件开发、车辆制造和服务运营方面提供全面解决方案[5] - 作为Autoware基金会的创始成员公司致力于通过开源软件让个人和组织在自动驾驶领域蓬勃发展[5]
美自动驾驶连遭挫折 Waymo因洪水预警再次暂停网约车服务
凤凰网· 2025-12-26 07:14
公司运营动态 - Waymo因美国国家气象局发布山洪预警 于周四暂时停止了在旧金山湾区的自动驾驶出租车服务 [1] - 公司在其网约车应用上发布乘客通知 称服务暂停是由于山洪预警 [1] - 公司未立即回应置评请求 也未说明暂停服务是否因监管部门针对山洪预警提出的要求 [1] 技术能力与挑战 - 公司本周早些时候表示将对车队进行更新 旨在使其自动驾驶出租车服务在停电期间具备更好的运行能力 [1] - 在12月20日 旧金山大停电期间 Waymo曾暂停服务 那次停电导致当地数万人断电 [1] - 12月20日的停电造成Waymo部分自动驾驶车辆在行驶途中停在路中间 从而加剧或直接引发了交通拥堵 [1]
Mercedes-Benz acquires stake in Chinese autonomous driving developer for US$191 million
Yahoo Finance· 2025-12-25 17:30
交易概述 - 梅赛德斯-奔驰数字技术公司完成了对重庆千里科技有限公司3%股权的收购 交易价值为13.4亿元人民币(1.91亿美元)[1] - 交易涉及从上市公司力帆控股处转让1.356亿股千里科技股份 每股价格为9.87元人民币[1] - 交易完成后 梅赛德斯-奔驰成为千里科技的第五大股东[2] 交易细节与承诺 - 此次股权转让不会导致公司控股股东和实际控制人发生变化 也不会影响收购要约[3] - 梅赛德斯-奔驰承诺至少12个月内不会减持其持有的千里科技股份[3] 战略背景与市场动态 - 此次收购突显了梅赛德斯-奔驰在全球最大汽车市场深化联系和战略合作的努力[3] - 上月 梅赛德斯-奔驰、特斯拉和沃尔沃成为首批获准在中国车辆中部署人工智能聊天机器人的外国汽车制造商[4] - 北京市网信办大约在同一时间将“梅赛德斯-奔驰虚拟助手”注册为生成式人工智能服务 上海方面则批准了特斯拉的xBot服务和沃尔沃的本地聊天机器人“小沃”[5] - 过去几个月 梅赛德斯-奔驰还投资了多家中国新兴的人工智能公司[6] 相关公司背景 - 交易前 前中国顶级摩托车制造商力帆控股持有千里科技超过5%的股份[2] - 力帆控股成立于1992年 最初是一家摩托车制造商 后业务拓展至汽车零部件 其投资者包括得到中国汽车制造商吉利和重庆市政府支持的私募股权基金[6] - 力帆控股董事长印奇曾联合创立并担任中国人工智能公司旷视科技的CEO 旷视科技获得了阿里巴巴集团控股的支持[7]
3 Self-Driving Tech Stocks to Ride into 2026 as AV Race Heats Up
ZACKS· 2025-12-24 00:45
行业概览与市场前景 - 自动驾驶汽车的发展正进入关键阶段 多家公司投入数十亿美元进行创新并争夺主导地位 无论是通过合作还是内部开发 大规模部署机器人出租车的竞赛将重塑交通行业[1] - 自动驾驶技术正快速成熟 全球自动驾驶市场预计将从2021年约1060亿美元增长至2030年超过2.3万亿美元[8] - 自动驾驶汽车的优势包括提升道路安全、提高效率与便利性、增加出行可及性以及降低交通成本和环境影响 这些因素共同使其成为变革性力量[3][4][5][6] 主要参与公司及进展 - 百度是机器人出租车领域的关键参与者 其Apollo Go服务已在超过20个城市提供完全无人驾驶的机器人出租车运营 并正在向迪拜和瑞士等国际市场拓展[11][13][14] - Alphabet旗下Waymo是美国市场的主要力量 每周付费出行已超过45万次 并在多个美国城市开展商业运营 包括在高速公路上运行完全无人驾驶的车辆[11][15][16] - 优步采用轻资产战略 通过战略合作伙伴关系整合前沿自动驾驶技术 利用其庞大的网约车网络和市场份额优势 专注于在郊区和低密度市场拓展自动驾驶服务[11][17][18][19] 公司财务与市场表现 - 百度2026年每股收益的共识预期显示同比增长16.8%[14] - Alphabet 2026年每股收益的共识预期显示同比增长4.1%[16] - 优步2026年每股收益的共识预期在过去60天内被上调了2.6%[19] - 百度、Alphabet和优步这三只股票在过去一年的表现均优于其所在板块[9]
走向融合统一的VLA和世界模型......
自动驾驶之心· 2025-12-23 17:29
文章核心观点 - 自动驾驶领域的两大前沿技术路线——视觉-语言-行动模型与世界模型正呈现出明显的融合趋势,其终极目标一致,旨在构建具备类人认知与决策能力的驾驶大脑 [2][5] - 两大技术路线并非对立,而是高度互补,未来将通过深度融合塑造“既会思考,又会沟通”的终极驾驶大脑,形成“感知-推理-仿真-决策-解释”的增强闭环 [19][51] VLA技术概述 - VLA是一种“视觉-语言-行动”模型,其输入为摄像头画面和人类语言指令,输出为直接的驾驶动作或轨迹,实现了从感知、理解到行动生成的端到端映射 [8][9] - 其系统架构分为三层:输入端融合多模态感知信息;中间层由视觉编码器、语言处理器与动作解码器构成,进行统一推理与决策生成;输出端直接驱动车辆 [9][10] World Model技术概述 - 世界模型是一种生成式时空神经网络系统,旨在让自动驾驶车辆具备“在脑海中预演未来”的能力,通过内部仿真评估不同决策后果,从而做出更安全、前瞻的规划 [12] - 其系统架构同样分为三层:输入端为时序多模态传感器数据;核心层负责状态编码、记忆与生成式推演;输出端提供未来场景表征,为下游规划模块提供前瞻信息 [13][14] VLA与世界模型的区别与联系 - **主要区别**:目标上,VLA侧重人车交互与可解释的端到端驾驶,世界模型侧重构建预测与仿真系统;输入上,VLA包含显式语言指令,世界模型侧重时序观测;输出上,VLA输出直接动作或轨迹,世界模型输出未来场景状态;技术上,VLA利用大模型推理能力,世界模型依赖状态编码与生成式预测 [15] - **核心联系**:技术起源背景一致,均源于对传统模块化pipeline的反思;终极目标一致,均旨在赋予机器类人的认知与决策能力;都面临解决长尾场景的挑战;技术底层均重度依赖“预训练+微调”范式与Transformer等核心架构 [16][17][18][19] VLA与世界模型的融合路径与案例 - **架构级融合**:以世界模型作为核心的“预测与仿真”引擎,以VLA作为“交互与决策解释”层,二者协同工作 [22] - **训练数据互补**:利用世界模型生成大量逼真场景数据训练VLA,同时VLA产生的语言标注数据可提升世界模型的语义理解 [22] - **形成闭环智能**:VLA做出初步决策,世界模型进行快速“脑内推演”并评估风险,再将信息反馈给VLA进行调整或解释 [22] - **3D-VLA**:由东北大学、加州大学洛杉矶分校、麻省理工学院等机构于2024年3月提出,是一个能打通3D感知、推理和动作生成的世界模型,其关键创新在于训练扩散模型来生成执行指令后的目标状态,让模型学会“想象未来” [24][25] - **WorldVLA**:由阿里巴巴达摩院、浙江大学等机构于2025年6月提出,是一个将VLA与世界模型统一于单一框架的自回归动作世界模型,实现了动作与图像的联合理解与生成,在机器人操作基准测试中动作生成成功率超过同类模型约4% [28][29][31] - **IRL-VLA**:由清华大学AIR研究院、上海交通大学等机构于2025年8月提出,是一种基于逆强化学习奖励世界模型的闭环强化学习框架,用于训练端到端自动驾驶VLA策略,在NAVSIM v2闭环驾驶基准上取得领先性能 [34][35] - **DriveVLA-W0**:由中国科学院自动化研究所等机构于2025年10月提出,通过引入未来图像预测作为密集自监督任务,解决VLA模型“监督不足”的问题,在NAVSIM基准测试中超越多传感器基线模型,并能放大数据扩展定律 [37][38][39][40] - **WM-MoE**:由麻省理工、夏威夷大学等机构于2025年10月提出,是一个基于世界模型并融合专家混合网络与大型语言模型的运动预测框架,旨在系统性解决自动驾驶中的极端案例难题,在多个公开数据集上展现出卓越的鲁棒性和泛化能力 [42][43][45] - **FutureSightDrive**:由西安交通大学、阿里巴巴达摩院等机构于2025年11月提出,其核心创新是引入视觉时空链式思考作为中间推理步骤,让VLA模型能够进行“视觉思考”,有效弥合了感知与规划之间的模态鸿沟 [47][49][50] 行业动态与展望 - 工业界已开始布局相关融合技术,例如华为强调其世界模型能力,小鹏汽车正在开发VLA 2.0,而理想汽车在发布会上也展示了相关理解,预计未来将有更多厂商入局 [51] - 下一代自动驾驶的发展方向预计将沿着VLA与世界模型深度融合的思路推进 [51]
Here’s What Wall Street Thinks About Pony AI (PONY)
Yahoo Finance· 2025-12-23 13:53
公司评级与目标价 - 巴克莱银行于12月16日首次覆盖小鹏汽车公司,给予“持有”评级,目标价为15美元 [1] - 麦格理集团于12月15日首次覆盖小鹏汽车公司,给予“买入”评级,目标价为29美元 [1] 分析师行业观点 - 巴克莱分析师认为中国大部分机器人技术已准备就绪,并看到了可行的商业模式,但对行业挑战持谨慎态度 [2] - 麦格理分析师看好中国自动驾驶行业,预计2026年将成为重要拐点,届时Robotaxi将从试点项目转变为可行的商业业务 [3] - 麦格理分析师指出,公司当前最大的挑战是监管而非技术,这是一个积极信号 [3] 公司业务与战略 - 小鹏汽车是一家领先的自动驾驶移动技术公司,利用其全栈自动驾驶技术“虚拟司机”实现自动驾驶汽车的大规模生产和部署 [5] - 麦格理分析师强调,公司应优先在中国一线城市建立市场地位,再向其他城市扩张,此战略有助于提升单车日均收入,从而改善单位经济效益 [4]
聊聊导航信息SD如何在自动驾驶中落地?
自动驾驶之心· 2025-12-23 08:53
导航信息在自动驾驶中的应用 - 图商提供的导航信息SD/SD Pro已在多个量产方案中使用,为车辆提供车道、粗粒度路径点等全局与局部视野信息,其应用顺理成章 [2] - 导航模块的核心职责之一是提供参考线,这能极大减轻下游规划控制模块的压力,车辆只需在参考线基础上进行细化 [4] - 导航模块还负责提供规划约束与优先级、路径监控和重规划等功能 [5] - 具体应用包括:进行车道级的全局路径规划,搜索目标车道的最优车道序列;为行为规划提供明确语义指导,方便车辆提前准备变道、减速、让行等操作 [6] 端到端自动驾驶算法框架 - 在两段式框架中,导航信息输入到感知模型,输出导航路径,该路径再作为机器学习规划器的输入,用于预测自车行驶轨迹 [16] - 在一段式框架中,SD信息经过专用编码器编码后,与动静态信息一同作为输入,参与后续的模型优化 [20] - 一段式框架相比两段式能做到信息无损传递,因此在性能上更具优势 [30] 行业课程内容概述 - 课程聚焦自动驾驶端到端技术的落地应用,涵盖一段式、两段式、强化学习、导航应用、轨迹优化及量产经验分享 [23] - 课程由工业界算法专家联合开设,讲师为国内顶级一级供应商算法专家,拥有大模型、世界模型等前沿算法的预研和量产落地经验 [25] - 课程面向进阶学员,需自备算力在4090及以上的GPU,并具备BEV感知、视觉Transformer、强化学习等算法基础 [38] - 课程采用离线视频教学,配合VIP群答疑及三次线上答疑,学习周期预计三个月 [36] 课程核心章节大纲 - 第一章概述端到端任务,介绍感知模型一体化架构、规控算法学习化方案及开源数据集与评测方式 [28] - 第二章详解两段式端到端算法框架,包括其建模方式、感知与规划控制的信息传递,并通过PLUTO算法进行实战 [29] - 第三章讲解一段式端到端算法框架,介绍基于向量逻辑架构和扩散模型等多种方案,并深入学习VAD系列方法 [30] - 第四章专述导航信息的量产应用,涵盖主流导航地图格式、内容信息及其在端到端模型中的编码与嵌入方式 [31] - 第五章介绍自动驾驶中的强化学习算法,旨在弥补纯模仿学习的不足,使系统学习因果关系以实现泛化 [32] - 第六章进行神经网络规划器项目实战,重点涵盖基于扩散模型和自回归模型的模仿学习,并结合强化学习算法 [33] - 第七章讲解量产兜底方案——时空联合规划,介绍多模态轨迹打分搜索及轨迹平滑等后处理优化算法 [34] - 第八章分享端到端量产经验,从数据、模型、场景、规则等多视角剖析如何提升系统能力边界 [35]
Baidu to bring robotaxi services to London via Uber and Lyft
Invezz· 2025-12-22 19:02
公司动态 - 中国科技集团百度确认计划从明年起在英国首都伦敦推出自动驾驶出租车[1] - 此举将使伦敦成为全球自动驾驶公司的下一个试验场[1] 行业趋势 - 全球自动驾驶公司正积极寻求在伦敦等国际大都市进行技术测试和商业化部署[1]