Autonomous Driving

搜索文档
登陆纳斯达克仅7个月,小马智行入选金龙指数
南方都市报· 2025-06-25 23:17
成分股调整与市场影响 - 小马智行首次入选纳斯达克中国金龙指数 成为指数中唯一代表L4级自动驾驶的前沿科技公司 [2] - 此次调整后指数共纳入73家中国企业 涵盖电商、新能源车、互联网等领域头部企业 [2] - 市场预计纳入将带来数亿美元量级被动资金配置 显著提升流动性与估值中枢 [2] - 公司从IPO到纳入核心指数仅用7个月 刷新中概股时间纪录 [2] - 消息公布当日纳斯达克中国金龙指数大涨3.3% 公司股价飙升16%领涨成分股 [4] 技术降本与商业化进展 - 第七代自动驾驶系统通过100%车规级设计 硬件成本较前代下降70% 其中计算单元降80% 激光雷达降68% [3] - 与丰田、北汽、广汽合作开发量产车型 计划2025年下半年在一线城市投放千台车队 [3] - 2024年Robotaxi业务收入同比激增200% 注册用户环比增长超20% [3] - 公司预计车队规模突破千台时将实现运营成本与收入动态平衡 [3] 全球化战略布局 - 与迪拜道路交通管理局达成战略合作 分阶段推进全无人Robotaxi商业化运营 并与当地轨道交通接驳 [7] - 已在韩国首尔、卢森堡启动路测 与新加坡康福德高联合开发出行服务 [7] - 获阿布扎比投资局、沙特新未来城基金等中东主权财富基金注资 [7] 行业趋势与定位 - 市场投资逻辑从"模式创新"转向"硬科技驱动" 自动驾驶赛道获资本认可 [4] - 公司形成"技术-资本-市场"三角闭环 推动自动驾驶规模化落地 [5]
Pony AI: The Next $1 Trillion Robotaxi Play?
The Motley Fool· 2025-06-25 18:00
公司发展 - 公司正在引领完全自动驾驶出租车(robotaxi)的部署竞赛 [1] - 近期技术进步可能推动股价创新高 [1] - 公司与优步、腾讯和丰田建立合作伙伴关系 [1] 市场前景 - 分析师对公司持乐观态度 [1] - 公司被视为1万亿美元规模的行业颠覆者 [1] 股价信息 - 2025年6月16日公司股价为16.73美元 [1][2] - 相关信息发布于2025年6月23日 [2]
Pony.ai Added to Nasdaq Golden Dragon China Index, Shares Surge 16.7%
Prnewswire· 2025-06-25 17:29
指数调整 - 小马智行(Pony.ai)被纳入纳斯达克金龙中国指数 成为该指数中唯一专注于自动驾驶技术的成分股 [1] - 调整于2025年6月23日生效 当前指数包含73家成分股 筛选标准基于市值和流动性 [2] - 指数覆盖科技(如阿里巴巴、网易)、消费服务(如京东、亚朵生活)、电动车(如蔚来、小鹏)等多个行业 [2] 指数背景 - 纳斯达克金龙中国指数成立于2003年 追踪在美国主要交易所上市的中国公司表现 是国际投资者参与中国经济的重要指标 [3] 公司表态 - 小马智行CFO表示此次纳入标志着公司2024年11月上市后的重要里程碑 有助于扩大投资者基础并提升全球知名度 [4] - 公司认为指数纳入将加速其自动驾驶技术在全球范围内的商业化进程 [4] 业务进展 - 公司运营约300辆Robotaxi 覆盖北京、上海、广州、深圳四大城市 可应对复杂交通场景和恶劣天气 [4] - 2025年4月发布第七代自动驾驶系统 全球首个采用100%车规级零部件 物料成本降低70% [5] - 计划2025年下半年与丰田、广汽、北汽联合量产第七代Robotaxi 年底前将车队规模扩大至1000辆 [5] 市场反应 - 6月24日公司股价上涨16.7%至13.3美元 同期纳斯达克金龙中国指数上涨3.3% 创逾一个月最大涨幅 [6]
小马智行纳入纳斯达克中国金龙指数
快讯· 2025-06-25 16:19
纳斯达克中国金龙指数成分股调整 - 小马智行被正式纳入纳斯达克中国金龙指数 [1] - 金龙指数是中概股投资标的风向标 [1] 小马智行资本市场影响 - 纳入指数意味着公司进入主流投资视野 [1] - 将吸引ETF基金、对冲基金、长线投资者的投资 [1] - 公司股票流动性和资本市场地位将进一步提升 [1] 行业意义 - 以小马智行为代表的中国自动驾驶科技获得资本市场认可 [1]
基于LSD的4D点云底图生成 - 4D标注之点云建图~
自动驾驶之心· 2025-06-24 20:41
4D标注技术 - 4D标注指三维空间+时间维度,能映射到任意时刻生成单帧真值用于模型训练,相比传统单帧标注可降低标注成本并提高数据质量[3] - 专注于小区域静态和动态元素标注,需支持"单趟建图"、"多趟建图"和"重定位"等关键技术[3] - 需适配有GNSS的行车场景和无GNSS的泊车场景[3] LSD框架 - 开源算法框架LSD整合数据采集、传感器标定、SLAM建图定位和障碍物检测功能,支持激光雷达4D点云底图生成[3][4] - 采用FASTLIO作为前端激光里程计,后端基于G2O融合GNSS观测和回环检测实现位姿图优化[7] 单趟建图技术 - 通过单次采集数据构建时空连续的高精度点云底图,适用于高速高架场景标注[5] - 采用FASTLIO前端里程计,后端融合GNSS观测和回环检测,优化GNSS异常点处理[7] - 处理GNSS异常点的两种策略:延迟使用(GNSS状态保持FIX 10秒才启用)和DCS鲁棒核函数(动态调整GNSS权重)[8][9][12] 雷达里程计退化处理 - 基于LOAM和X-ICP方法实现退化检测,通过特征贡献度分析识别退化方向[15] - 在隧道等退化场景中融合轮速传感器观测,提升纵向定位精度[17][18][19] GNSS杆臂误差校正 - 杆臂误差导致车辆转弯时点云重影,LSD将杆臂作为三维变量在PGO中估计[21][25][26] - 添加(0,0,0)先验约束解决不可观测性问题,优化后消除60cm错位[27][28][30] 回环检测与地图管理 - 通过GICP匹配实现地下停车场回环检测,减少里程计累积误差[31][32] - 采用ivox结构替代ikd-tree管理局部地图,通过LRU缓存和行驶距离约束避免重影[34][37] 多趟建图与地图合并 - 行车场景通过坐标系统一和GICP匹配优化合并多趟地图[40] - 泊车场景采用ScanContext+PCM算法估计坐标系变换矩阵实现无GNSS地图合并[42] 重定位应用 - 在标注真值底图上实现重定位以持续获取新数据标注,降低边际成本[44] - 采用固定真值地图关键帧节点的优化方案[44] 行业技术趋势 - 数据驱动算法推动4D标注需求增长,LSD框架提供开源解决方案[3][47] - 多传感器融合(激光雷达+GNSS+轮速)和退化场景优化成为技术重点[15][17][40]
Robotaxi市场竞争激烈:小马智行率先向文远知行开炮
36氪· 2025-06-24 08:13
行业前景 - 全球Robotaxi市场规模2024年预计为19.5亿美元,2030年有望达到437.6亿美元(Grand View Research)[1] - 天风证券预测2030年全球Robotaxi规模将达8349亿元人民币[1] 竞争格局 - 行业呈现萝卜快跑、文远知行和小马智行"三强争霸"格局[12] - 小马智行CTO楼天城称仅有Waymo、小马智行和百度达到规模化与无人化标准,其他公司落后两年半[2] - 文远知行CFO李璇公开反驳,指出小马智行运营问题并强调实际落地能力[2] - 两家公司均获Uber投资并达成中东市场合作协议[10] 公司背景 - 小马智行成立于2016年12月,由前百度自动驾驶首席架构师彭军和楼天城创立[6] - 文远知行前身景驰科技成立于2017年4月,由前百度自动驾驶团队韩旭和王劲创立[6] - 两家公司累计融资额均为13亿美元左右[9] 技术路线 - 小马智行采用"Robotaxi+Robotruck"双轮驱动,专注L4级全无人驾驶技术,强调冗余性与安全性[7] - 文远知行采取"全场景覆盖"策略,构建五大产品矩阵,注重技术泛化能力[9] - 小马智行每周生成超100亿英里虚拟测试数据[7] - 文远知行在瑞士苏黎世落地欧洲首个商业化机场Robobus项目[9] 财务数据 - 小马智行2022-2024年累计营收2.15亿美元(约16.46亿元人民币)[16] - 文远知行同期累计营收11.80亿元人民币[16] - 2024年小马智行Robotaxi营收占比9.7%,文远知行Robotaxi营收占比15.6%[16] - 小马智行2022-2024年累计研发投入5.17亿美元(约37.17亿元人民币)[14] - 文远知行同期累计研发投入29.08亿元人民币[14] 资产与现金流 - 2024年末文远知行总资产76.94亿元,净资产70.66亿元,资产负债率8.16%[18] - 2024年末小马智行总资产10.51亿美元,净资产9.69亿美元,资产负债率7.80%[18] - 文远知行2024年末现金及等价物42.68亿元,同比增长156.95%[19] - 小马智行2024年末现金及等价物5.36亿美元,同比增长25.82%[19] 市场表现 - 2024年10月文远知行率先登陆纳斯达克,首日市值44.91亿美元[12] - 小马智行一个月后上市,首日市值41.88亿美元[12] - 截至2024年6月小马智行Robotaxi车队累计路测里程超3350万公里[16] - 文远知行同期全球自动驾驶运行总里程超4000万公里[16] 国际化布局 - 小马智行聚焦中国市场,服务覆盖北上广深等一线城市核心区域[21] - 文远知行采取全球化战略,业务覆盖9国30城[21] - 小马智行2025年Q1乘客车费收入同比增长800%,日均订单量超15单[21] - 文远知行在阿布扎比开启纯无人驾驶Robotaxi试运营[10] 专利与知识产权 - 文远知行申请921项专利,小马智行申请93项专利[14] - 小马智行商标信息892条,文远知行商标信息381条[14]
上交&卡尔动力FastDrive!结构化标签实现端到端大模型更快更强~
自动驾驶之心· 2025-06-23 19:34
端到端自动驾驶研究进展 - 将类人推理能力融入端到端自动驾驶系统成为前沿领域 视觉语言模型(VLM)方法受到工业界和学术界广泛关注[1] - 现有VLM训练范式依赖自由格式文本标注 存在同义表达复杂性和信息冗余问题 增加模型学习难度和计算开销[1] - 基准模型通常依赖超70亿参数的大语言模型 导致高昂计算成本、内存消耗和推理延迟[3] NuScenes-S结构化数据集 - 数据集包含102K问答对 其中84K用于训练 18K用于测试[21] - 场景描述结构化要素包括:天气(5类)、交通状况(3类)、驾驶区域(7类)、交通灯(3类)、交通标志(8类)、道路状况(4类)、车道线(8类)、时间(2类)[7][8] - 感知预测任务包含:相机视角(6类)、2D边界框坐标、未来状态(7类)[12] - 决策任务分为横向移动(5类)和纵向移动(4类)[13] - 构建过程采用GPT预标注+人工细化的混合方式 通过规则提取关键目标[9] FastDrive算法模型 - 采用0.9B参数紧凑设计 相比传统70亿+参数模型大幅降低计算资源需求[4] - 网络架构遵循"ViT-Adapter-LLM"范式 包含视觉编码器(ViT主干)和LLM代理(Qwen2.5)[17][19] - 引入TokenPacker模块减少标记数量 提升推理速度[18] - 实现思维链式推理流程 完成场景理解→感知→预测→决策的全流程[19] 实验性能表现 - 语言指标:FastDrive256版本BLEU-4达70.36 ROUGE_L达87.24 显著优于DriveLM基准[22] - 场景理解准确率:天气识别99.95% 交通标志识别87.64% 全面超越对比模型[22] - 预测决策任务:在车道线状态预测(76.49%)和纵向控制决策(82.06%)等关键指标领先[22][25] - 消融实验证实结构化标注使决策准确率提升12.8%[24][25] 技术社区生态 - 自动驾驶技术社区覆盖30+技术方向 包括BEV感知、多传感器融合、轨迹预测等前沿领域[27] - 专业课程体系包含端到端自动驾驶、大模型部署、NeRF等20+细分方向[29] - 行业参与度:近300家企业和科研机构加入 形成4000人规模交流社区[27]
ADAS新范式!北理&清华MMTL-UniAD:多模态和多任务学习统一SOTA框架(CVPR'25)
自动驾驶之心· 2025-06-23 19:34
核心观点 - 提出统一的多模态多任务学习框架MMTL-UniAD,可同步识别驾驶员行为、情绪、交通环境及车辆行为四项任务,解决现有研究忽视任务间联合学习潜力的问题 [1][5][26] - 通过多轴区域注意力网络(MARNet)和双分支多模态嵌入模块两大核心组件,有效缓解多任务学习中的负迁移现象,实现任务共享特征与特有特征的动态平衡 [5][7][14] - 在AIDE数据集上验证显示,MMTL-UniAD在四项任务中均达到SOTA性能,mAcc指标提升4.10%-12.09%,驾驶员行为识别和车辆行为识别准确率分别提升4.64%和3.62% [18][26] 算法设计 多轴区域注意力网络(MARNet) - 采用水平-垂直双向注意力机制提取全局上下文信息,结合区域注意力筛选任务相关特征,减少无关特征导致的负迁移 [11][12] - 将特征图划分为独立区域并计算区域级注意力,通过相似度矩阵选取最相似邻域区域,增强关键特征提取能力 [12] 双分支多模态嵌入模块 - 任务共享分支整合多模态信息学习通用表示,任务特有分支通过一维卷积和多头注意力动态调整模态权重,保留任务特性 [14][16] - 自适应调节两类特征权重,实验表明移除该模块会导致mAcc下降5.34%,验证其平衡共享与特有特征的有效性 [25] 实验结果 性能对比 - 在2D模型、2D+时序建模、3D模型三类对比方法中全面领先,四项任务最高准确率达DER 76.67%、DBR 73.61%、TCR 93.91%、VBR 85.00% [18][20] - 消融实验显示,联合训练驾驶员状态与交通环境任务可使双方准确率提升3.50%-4.45%,单任务训练会导致性能下降3.98%-6.13% [22][23] 模块贡献 - 单独移除MARNet或双分支模块均导致mAcc下降至70.25%-76.96%,证明二者协同作用对性能提升的关键性 [24][25] - 多模态数据联合使用(面部+身体姿态+场景)相比单一模态可使mAcc提升5.39%-26.61% [25] 行业意义 - 为ADAS领域提供首个整合驾驶员状态与交通环境识别的多任务框架,推动跨模态特征共享技术发展 [5][26] - 开源代码与模型结构有望成为行业基准,加速智能辅助驾驶系统向高效自适应方向演进 [1][26]
量产项目卡在了场景泛化,急需千万级自动标注?
自动驾驶之心· 2025-06-21 21:15
而自从端到端和大语言LLM横空出世以来,大规模无监督的预训练 + 高质量数据集做具体任务的微调, 可能也会成为量产感知算法下一阶段需要发力的方向。同时数 据的联合标注也是当下各家训练模型的实际刚需,以往分开标注的范式不再适合智能驾驶的算法发展需求。今天自动驾驶之心就和大家一起分享下4D数据的标注流 程: 最复杂的当属动态障碍物的自动标注,涉及四个大的模块: 而为了尽可能的提升3D检测的性能,业内使用最多的还是点云3D目标检测或者LV融合的方法: 得到离线单帧的3D检测结果后,需要利用跟踪把多帧结果串联起来,但当下跟踪也面临诸多的实际问题: 离线3D目标检测; 离线跟踪; 后处理优化; 传感器遮挡优化; 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 千万级4D标注方案应该怎么做? 智能驾驶算法的开发已经到了深水区,各家都投入了大量的精力去做量产落地。其中一块最关键的就是如何高效的完成4D数据标注。无论是3D动态目标、OCC还是静 态标注。 相比于车端的感知算法,自动标注系统更像是一个不同模块组成的系统, 充分利用离线的算力和时序信息,才能得到更好的感知结果 ...
自动驾驶基础模型全面盘点(LLM/VLM/MLLM/扩散模型/世界模型)
自动驾驶之心· 2025-06-21 19:18
基础模型在自动驾驶场景生成与分析中的应用 - 基础模型(Foundation Models)能够处理异构输入(如自然语言、传感器数据、高清地图和控制指令),实现对复杂驾驶场景的合成与解析 [2] - 文章提出了一个统一分类体系,涵盖大语言模型(LLMs)、视觉-语言模型(VLMs)、多模态大型语言模型(MLLMs)、扩散模型(DMs)和世界模型(WMs)在自动驾驶场景生成与分析中的应用 [2] - 传统场景生成方法存在多样性有限和难以生成真实高风险场景的问题,而基础模型可以解决这些挑战 [2] 语言模型在场景生成中的应用 - 使用GPT-4、Claude 3.5 Sonnet、Gemini 1.5 Pro等大语言模型生成安全关键场景 [9] - 采用CoT(Chain-of-Thought prompting)、ICL(In-Context Learning)、RAG(Retrieval-Augmented Generation)等技术 [9] - 在CARLA、MetaDrive、SUMO等仿真平台上测试生成的场景 [9] 视觉-语言模型在场景分析中的应用 - 使用BLIP2、InstructBLIP2、MiniGPT4等视觉-语言模型进行场景理解和视觉问答 [18] - 在nuScenes、Waymo Open等数据集上进行感知、预测和规划任务 [18] - 采用零样本学习、LoRA(Low-Rank Adaptation)等技术 [18] 扩散模型在场景生成中的应用 - 使用DDPM、DiT、LDM等扩散模型生成交通流和静态交通元素 [27] - 可以控制场景参数如速度、目标航点、交通密度等 [27] - 在nuScenes、Argoverse 2、WOMD等数据集上进行测试 [27] 世界模型在场景生成中的应用 - 使用GAIA-1、DriveDreamer等世界模型进行未来预测和场景生成 [33] - 采用自回归、扩散等架构 [33] - 在nuScenes、Waymo Open等数据集上进行训练和测试 [33] 数据集和仿真平台 - nuScenes、Waymo Open、DRAMA、HighD是最具影响力的数据集 [35] - CARLA、MetaDrive、LGSVL、SUMO是最常用的仿真平台 [36] - 这些资源为自动驾驶场景生成与分析研究提供了重要支持 [35][36]