Autonomous Driving

搜索文档
小马智行纳入纳斯达克中国金龙指数
快讯· 2025-06-25 16:19
纳斯达克中国金龙指数成分股调整 - 小马智行被正式纳入纳斯达克中国金龙指数 [1] - 金龙指数是中概股投资标的风向标 [1] 小马智行资本市场影响 - 纳入指数意味着公司进入主流投资视野 [1] - 将吸引ETF基金、对冲基金、长线投资者的投资 [1] - 公司股票流动性和资本市场地位将进一步提升 [1] 行业意义 - 以小马智行为代表的中国自动驾驶科技获得资本市场认可 [1]
基于LSD的4D点云底图生成 - 4D标注之点云建图~
自动驾驶之心· 2025-06-24 20:41
4D标注技术 - 4D标注指三维空间+时间维度,能映射到任意时刻生成单帧真值用于模型训练,相比传统单帧标注可降低标注成本并提高数据质量[3] - 专注于小区域静态和动态元素标注,需支持"单趟建图"、"多趟建图"和"重定位"等关键技术[3] - 需适配有GNSS的行车场景和无GNSS的泊车场景[3] LSD框架 - 开源算法框架LSD整合数据采集、传感器标定、SLAM建图定位和障碍物检测功能,支持激光雷达4D点云底图生成[3][4] - 采用FASTLIO作为前端激光里程计,后端基于G2O融合GNSS观测和回环检测实现位姿图优化[7] 单趟建图技术 - 通过单次采集数据构建时空连续的高精度点云底图,适用于高速高架场景标注[5] - 采用FASTLIO前端里程计,后端融合GNSS观测和回环检测,优化GNSS异常点处理[7] - 处理GNSS异常点的两种策略:延迟使用(GNSS状态保持FIX 10秒才启用)和DCS鲁棒核函数(动态调整GNSS权重)[8][9][12] 雷达里程计退化处理 - 基于LOAM和X-ICP方法实现退化检测,通过特征贡献度分析识别退化方向[15] - 在隧道等退化场景中融合轮速传感器观测,提升纵向定位精度[17][18][19] GNSS杆臂误差校正 - 杆臂误差导致车辆转弯时点云重影,LSD将杆臂作为三维变量在PGO中估计[21][25][26] - 添加(0,0,0)先验约束解决不可观测性问题,优化后消除60cm错位[27][28][30] 回环检测与地图管理 - 通过GICP匹配实现地下停车场回环检测,减少里程计累积误差[31][32] - 采用ivox结构替代ikd-tree管理局部地图,通过LRU缓存和行驶距离约束避免重影[34][37] 多趟建图与地图合并 - 行车场景通过坐标系统一和GICP匹配优化合并多趟地图[40] - 泊车场景采用ScanContext+PCM算法估计坐标系变换矩阵实现无GNSS地图合并[42] 重定位应用 - 在标注真值底图上实现重定位以持续获取新数据标注,降低边际成本[44] - 采用固定真值地图关键帧节点的优化方案[44] 行业技术趋势 - 数据驱动算法推动4D标注需求增长,LSD框架提供开源解决方案[3][47] - 多传感器融合(激光雷达+GNSS+轮速)和退化场景优化成为技术重点[15][17][40]
Robotaxi市场竞争激烈:小马智行率先向文远知行开炮
36氪· 2025-06-24 08:13
行业前景 - 全球Robotaxi市场规模2024年预计为19.5亿美元,2030年有望达到437.6亿美元(Grand View Research)[1] - 天风证券预测2030年全球Robotaxi规模将达8349亿元人民币[1] 竞争格局 - 行业呈现萝卜快跑、文远知行和小马智行"三强争霸"格局[12] - 小马智行CTO楼天城称仅有Waymo、小马智行和百度达到规模化与无人化标准,其他公司落后两年半[2] - 文远知行CFO李璇公开反驳,指出小马智行运营问题并强调实际落地能力[2] - 两家公司均获Uber投资并达成中东市场合作协议[10] 公司背景 - 小马智行成立于2016年12月,由前百度自动驾驶首席架构师彭军和楼天城创立[6] - 文远知行前身景驰科技成立于2017年4月,由前百度自动驾驶团队韩旭和王劲创立[6] - 两家公司累计融资额均为13亿美元左右[9] 技术路线 - 小马智行采用"Robotaxi+Robotruck"双轮驱动,专注L4级全无人驾驶技术,强调冗余性与安全性[7] - 文远知行采取"全场景覆盖"策略,构建五大产品矩阵,注重技术泛化能力[9] - 小马智行每周生成超100亿英里虚拟测试数据[7] - 文远知行在瑞士苏黎世落地欧洲首个商业化机场Robobus项目[9] 财务数据 - 小马智行2022-2024年累计营收2.15亿美元(约16.46亿元人民币)[16] - 文远知行同期累计营收11.80亿元人民币[16] - 2024年小马智行Robotaxi营收占比9.7%,文远知行Robotaxi营收占比15.6%[16] - 小马智行2022-2024年累计研发投入5.17亿美元(约37.17亿元人民币)[14] - 文远知行同期累计研发投入29.08亿元人民币[14] 资产与现金流 - 2024年末文远知行总资产76.94亿元,净资产70.66亿元,资产负债率8.16%[18] - 2024年末小马智行总资产10.51亿美元,净资产9.69亿美元,资产负债率7.80%[18] - 文远知行2024年末现金及等价物42.68亿元,同比增长156.95%[19] - 小马智行2024年末现金及等价物5.36亿美元,同比增长25.82%[19] 市场表现 - 2024年10月文远知行率先登陆纳斯达克,首日市值44.91亿美元[12] - 小马智行一个月后上市,首日市值41.88亿美元[12] - 截至2024年6月小马智行Robotaxi车队累计路测里程超3350万公里[16] - 文远知行同期全球自动驾驶运行总里程超4000万公里[16] 国际化布局 - 小马智行聚焦中国市场,服务覆盖北上广深等一线城市核心区域[21] - 文远知行采取全球化战略,业务覆盖9国30城[21] - 小马智行2025年Q1乘客车费收入同比增长800%,日均订单量超15单[21] - 文远知行在阿布扎比开启纯无人驾驶Robotaxi试运营[10] 专利与知识产权 - 文远知行申请921项专利,小马智行申请93项专利[14] - 小马智行商标信息892条,文远知行商标信息381条[14]
上交&卡尔动力FastDrive!结构化标签实现端到端大模型更快更强~
自动驾驶之心· 2025-06-23 19:34
端到端自动驾驶研究进展 - 将类人推理能力融入端到端自动驾驶系统成为前沿领域 视觉语言模型(VLM)方法受到工业界和学术界广泛关注[1] - 现有VLM训练范式依赖自由格式文本标注 存在同义表达复杂性和信息冗余问题 增加模型学习难度和计算开销[1] - 基准模型通常依赖超70亿参数的大语言模型 导致高昂计算成本、内存消耗和推理延迟[3] NuScenes-S结构化数据集 - 数据集包含102K问答对 其中84K用于训练 18K用于测试[21] - 场景描述结构化要素包括:天气(5类)、交通状况(3类)、驾驶区域(7类)、交通灯(3类)、交通标志(8类)、道路状况(4类)、车道线(8类)、时间(2类)[7][8] - 感知预测任务包含:相机视角(6类)、2D边界框坐标、未来状态(7类)[12] - 决策任务分为横向移动(5类)和纵向移动(4类)[13] - 构建过程采用GPT预标注+人工细化的混合方式 通过规则提取关键目标[9] FastDrive算法模型 - 采用0.9B参数紧凑设计 相比传统70亿+参数模型大幅降低计算资源需求[4] - 网络架构遵循"ViT-Adapter-LLM"范式 包含视觉编码器(ViT主干)和LLM代理(Qwen2.5)[17][19] - 引入TokenPacker模块减少标记数量 提升推理速度[18] - 实现思维链式推理流程 完成场景理解→感知→预测→决策的全流程[19] 实验性能表现 - 语言指标:FastDrive256版本BLEU-4达70.36 ROUGE_L达87.24 显著优于DriveLM基准[22] - 场景理解准确率:天气识别99.95% 交通标志识别87.64% 全面超越对比模型[22] - 预测决策任务:在车道线状态预测(76.49%)和纵向控制决策(82.06%)等关键指标领先[22][25] - 消融实验证实结构化标注使决策准确率提升12.8%[24][25] 技术社区生态 - 自动驾驶技术社区覆盖30+技术方向 包括BEV感知、多传感器融合、轨迹预测等前沿领域[27] - 专业课程体系包含端到端自动驾驶、大模型部署、NeRF等20+细分方向[29] - 行业参与度:近300家企业和科研机构加入 形成4000人规模交流社区[27]
ADAS新范式!北理&清华MMTL-UniAD:多模态和多任务学习统一SOTA框架(CVPR'25)
自动驾驶之心· 2025-06-23 19:34
核心观点 - 提出统一的多模态多任务学习框架MMTL-UniAD,可同步识别驾驶员行为、情绪、交通环境及车辆行为四项任务,解决现有研究忽视任务间联合学习潜力的问题 [1][5][26] - 通过多轴区域注意力网络(MARNet)和双分支多模态嵌入模块两大核心组件,有效缓解多任务学习中的负迁移现象,实现任务共享特征与特有特征的动态平衡 [5][7][14] - 在AIDE数据集上验证显示,MMTL-UniAD在四项任务中均达到SOTA性能,mAcc指标提升4.10%-12.09%,驾驶员行为识别和车辆行为识别准确率分别提升4.64%和3.62% [18][26] 算法设计 多轴区域注意力网络(MARNet) - 采用水平-垂直双向注意力机制提取全局上下文信息,结合区域注意力筛选任务相关特征,减少无关特征导致的负迁移 [11][12] - 将特征图划分为独立区域并计算区域级注意力,通过相似度矩阵选取最相似邻域区域,增强关键特征提取能力 [12] 双分支多模态嵌入模块 - 任务共享分支整合多模态信息学习通用表示,任务特有分支通过一维卷积和多头注意力动态调整模态权重,保留任务特性 [14][16] - 自适应调节两类特征权重,实验表明移除该模块会导致mAcc下降5.34%,验证其平衡共享与特有特征的有效性 [25] 实验结果 性能对比 - 在2D模型、2D+时序建模、3D模型三类对比方法中全面领先,四项任务最高准确率达DER 76.67%、DBR 73.61%、TCR 93.91%、VBR 85.00% [18][20] - 消融实验显示,联合训练驾驶员状态与交通环境任务可使双方准确率提升3.50%-4.45%,单任务训练会导致性能下降3.98%-6.13% [22][23] 模块贡献 - 单独移除MARNet或双分支模块均导致mAcc下降至70.25%-76.96%,证明二者协同作用对性能提升的关键性 [24][25] - 多模态数据联合使用(面部+身体姿态+场景)相比单一模态可使mAcc提升5.39%-26.61% [25] 行业意义 - 为ADAS领域提供首个整合驾驶员状态与交通环境识别的多任务框架,推动跨模态特征共享技术发展 [5][26] - 开源代码与模型结构有望成为行业基准,加速智能辅助驾驶系统向高效自适应方向演进 [1][26]
量产项目卡在了场景泛化,急需千万级自动标注?
自动驾驶之心· 2025-06-21 21:15
而自从端到端和大语言LLM横空出世以来,大规模无监督的预训练 + 高质量数据集做具体任务的微调, 可能也会成为量产感知算法下一阶段需要发力的方向。同时数 据的联合标注也是当下各家训练模型的实际刚需,以往分开标注的范式不再适合智能驾驶的算法发展需求。今天自动驾驶之心就和大家一起分享下4D数据的标注流 程: 最复杂的当属动态障碍物的自动标注,涉及四个大的模块: 而为了尽可能的提升3D检测的性能,业内使用最多的还是点云3D目标检测或者LV融合的方法: 得到离线单帧的3D检测结果后,需要利用跟踪把多帧结果串联起来,但当下跟踪也面临诸多的实际问题: 离线3D目标检测; 离线跟踪; 后处理优化; 传感器遮挡优化; 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 千万级4D标注方案应该怎么做? 智能驾驶算法的开发已经到了深水区,各家都投入了大量的精力去做量产落地。其中一块最关键的就是如何高效的完成4D数据标注。无论是3D动态目标、OCC还是静 态标注。 相比于车端的感知算法,自动标注系统更像是一个不同模块组成的系统, 充分利用离线的算力和时序信息,才能得到更好的感知结果 ...
自动驾驶基础模型全面盘点(LLM/VLM/MLLM/扩散模型/世界模型)
自动驾驶之心· 2025-06-21 19:18
基础模型在自动驾驶场景生成与分析中的应用 - 基础模型(Foundation Models)能够处理异构输入(如自然语言、传感器数据、高清地图和控制指令),实现对复杂驾驶场景的合成与解析 [2] - 文章提出了一个统一分类体系,涵盖大语言模型(LLMs)、视觉-语言模型(VLMs)、多模态大型语言模型(MLLMs)、扩散模型(DMs)和世界模型(WMs)在自动驾驶场景生成与分析中的应用 [2] - 传统场景生成方法存在多样性有限和难以生成真实高风险场景的问题,而基础模型可以解决这些挑战 [2] 语言模型在场景生成中的应用 - 使用GPT-4、Claude 3.5 Sonnet、Gemini 1.5 Pro等大语言模型生成安全关键场景 [9] - 采用CoT(Chain-of-Thought prompting)、ICL(In-Context Learning)、RAG(Retrieval-Augmented Generation)等技术 [9] - 在CARLA、MetaDrive、SUMO等仿真平台上测试生成的场景 [9] 视觉-语言模型在场景分析中的应用 - 使用BLIP2、InstructBLIP2、MiniGPT4等视觉-语言模型进行场景理解和视觉问答 [18] - 在nuScenes、Waymo Open等数据集上进行感知、预测和规划任务 [18] - 采用零样本学习、LoRA(Low-Rank Adaptation)等技术 [18] 扩散模型在场景生成中的应用 - 使用DDPM、DiT、LDM等扩散模型生成交通流和静态交通元素 [27] - 可以控制场景参数如速度、目标航点、交通密度等 [27] - 在nuScenes、Argoverse 2、WOMD等数据集上进行测试 [27] 世界模型在场景生成中的应用 - 使用GAIA-1、DriveDreamer等世界模型进行未来预测和场景生成 [33] - 采用自回归、扩散等架构 [33] - 在nuScenes、Waymo Open等数据集上进行训练和测试 [33] 数据集和仿真平台 - nuScenes、Waymo Open、DRAMA、HighD是最具影响力的数据集 [35] - CARLA、MetaDrive、LGSVL、SUMO是最常用的仿真平台 [36] - 这些资源为自动驾驶场景生成与分析研究提供了重要支持 [35][36]
文远知行全球化运营获中信证券认可,Robotaxi商业化即将驶入“快车道”
搜狐财经· 2025-06-20 10:04
公司评级与目标价 - 中信证券首次覆盖文远知行给予"买入"评级 目标价17美元 较当前价7 72美元有显著上涨空间 [1][2] - 评级基于公司在自动驾驶行业的技术领先地位与全球化布局优势 [2] 行业前景与政策支持 - 中信证券测算2030年国内Robotaxi市场规模有望达6000亿元 [4] - 北京 广州等地2025年出台新政鼓励Robotaxi落地 如《广州市智能网联汽车创新发展条例》提出推进混行试点区建设 [4] - Robotaxi被视为最具潜力的L4级自动驾驶场景 Robovan Robobus等固定路线场景可能更快规模化 [4] 公司商业化进展 - 文远知行2019年在广州推出中国首个公开收费Robotaxi服务 目前已在4国8城构建运营网络 覆盖北京 广州核心区域 [5] - 2025Q1公司Robotaxi收入与订单同比高增 与小马智行 萝卜快跑共同推动商业化加速 [4] - 欧美市场因出租车定价更高 Robotaxi有望更快实现单车毛利转正 公司海外布局领先 [5] 全球化战略与合作伙伴 - 文远知行手握中 法 美 阿联酋 新加坡五国自动驾驶牌照 全球运营网络覆盖中东 欧洲等地 [2][5] - 与Uber深化合作 已在阿布扎比 迪拜推出Robotaxi服务 计划未来5年拓展至15座城市 [5][6] - 2025年5月获Uber追加1亿美元股权投资 显示战略合作伙伴认可 [5]
Why Now is the Time to Buy PONY Stock Post a 29.5% Drop in a Month
ZACKS· 2025-06-13 00:51
股价表现 - 小马智行(PONY)股价在过去30天内暴跌29.5%,表现远逊于Zacks运输设备租赁行业同期1.4%的跌幅[1] - 该股在2024年11月纳斯达克上市后,曾在2025年4月中旬至5月中旬暴涨超245%[4] - 当前股价12.65美元,较52周高点低88.8%[5] 业务扩张 - 计划在2025年底前将robotaxi车队规模扩大至1000辆以上[8] - 2024年末已部署约250辆robotaxi,第七代车型正在广州、深圳进行测试[9] - 采用轻资产+AI赋能模式,与深圳西湖集团合作在当地部署千辆级robotaxi车队[10] 战略合作 - 与丰田汽车成立合资企业,利用广汽丰田产能大规模生产无人驾驶robotaxi[10] - 2025年5月与优步达成合作,计划在中东关键市场率先部署robotaxi服务[10] - 供应链本地化率超90%,通过供应商多元化和库存管理增强抗风险能力[11] 市场前景 - 中国robotaxi市场规模2024年达120亿美元,受益于政策支持、人口红利和高效供应链[12] - 华尔街平均目标价23.5美元,隐含85%上涨空间[13] - 第七代robotaxi已获地方政府支持,商业化牌照申请进展顺利[9]
连续17日净流入,份额规模均创历史新高,重组事件中科曙光受益,计算机ETF(159998)持仓股中科曙光单只成分股含量超6.8%
新浪财经· 2025-06-11 09:54
海光信息与中科曙光换股合并 - 海光信息拟通过发行股份换股吸收合并中科曙光,并向不超过35名特定投资者募集配套资金 [2] - 合并前中科曙光持有海光信息27.96%股份,合并后中科曙光终止上市,海光信息承继其全部资产及负债 [2] - 换股比例为1股中科曙光兑换0.5525股海光信息股票,按停牌前股价计算理论溢价空间达21.5%(海光136.13元/股,曙光61.90元/股) [2] - 复牌当日中科曙光股票涨停 [5] 市场资金动向 - 计算机ETF(159998)近17天净流入3.37亿元,规模达30.82亿元创历史新高,中科曙光占净值比6.86% [2] - 云计算ETF沪港深(517390)年内净流入超2亿元,中科曙光占净值比6.39%,覆盖港股互联网及AI龙头公司 [3] 科技行业投资机会 - 申万宏源认为AI、具身智能、国防军工可能成为结构牛核心产业趋势,下半年关注DeepSeekR2、GPT5和特斯拉Optimus量产版本 [3] - 科技板块当前处于震荡市,建议把握高性价比反弹机会,重点关注软件、硬件技术及AI相关领域(数据中心/自动驾驶/机器人) [3] - 华龙证券指出算力租赁行业订单激增反映高景气度,国产模型技术迭代推动算力需求增长,行业拐点显现 [4] - 国产算力产业链协同发展加速,性能与稳定性提升缩小国际差距,宏景科技等公司大额订单印证下游需求旺盛 [4]