Autonomous Driving

搜索文档
WeRide Robotaxi Secures Autonomous Driving Permit in Saudi Arabia, Products Now Licensed in Six Countries
Globenewswire· 2025-07-28 18:39
公司动态 - 公司获得沙特阿拉伯首个Robotaxi自动驾驶许可证,成为全球唯一在六个国家(沙特阿拉伯、中国、阿联酋、新加坡、法国和美国)持有自动驾驶许可证的技术公司 [1] - 公司被授权在沙特阿拉伯全国范围内运营自动驾驶车辆业务并部署Robotaxi,首先在利雅得与Uber和当地合作伙伴Ai Driver开展试点运营 [2] - 试点项目覆盖哈立德国王国际机场和利雅得多个关键地点,包括主要高速公路和精选市中心目的地,预计2025年底通过与Uber的合作推出全面商业化Robotaxi服务 [3] - 公司是首家完成沙特阿拉伯TGA自动驾驶试点监管沙盒的AV技术公司,审批过程包括严格测试、评估和技术验证以确保最高安全标准 [5] 业务拓展 - 公司已在沙特阿拉伯测试和运营Robobus,地点包括法赫德国王医疗城、阿美石油公司住宅社区、欧拉和利雅得丽思卡尔顿酒店 [7] - Robosweeper S1在法赫德国王医疗城运营,标志着沙特阿拉伯和中东地区首个商业化自动驾驶环卫项目 [7] - 公司在中东地区快速扩张,Robotaxi正在阿布扎比进行完全无人驾驶测试,这是中东首次此类部署,并计划很快将Robotaxi服务扩展至迪拜 [8] 公司背景 - 公司是全球自动驾驶行业领导者和先行者,也是首家公开上市的Robotaxi公司 [9] - 公司自动驾驶车辆已在10个国家的30多个城市进行测试或运营 [9] - 公司产品线覆盖L2至L4级别自动驾驶,满足出行、物流和环卫行业的交通需求 [9] - 公司入选《财富》杂志2024年"未来50强"榜单 [9]
Pony AI Inc. to Report Second Quarter 2025 Financial Results on August 12, 2025
Globenewswire· 2025-07-28 17:00
文章核心观点 公司将公布2025年第二季度未经审计财务结果并召开财报电话会议 [1][2] 财务结果公布 - 公司将于2025年8月12日美国市场开盘前公布2025年第二季度未经审计财务结果 [1] 财报电话会议安排 - 公司管理层将于2025年8月12日美国东部时间上午8点(北京时间/香港时间晚上8点)举行财报电话会议 [2] - 电话参会者需在会议开始前通过指定链接完成在线注册,注册后将收到包含拨号号码、密码和唯一访问PIN的确认邮件 [2] - 会议重播至2025年8月19日可通过指定号码拨打,访问代码为3152089 [3] - 会议直播和存档网络直播可在公司投资者关系网站查看 [3] 公司介绍 - 公司是全球自动驾驶大规模商业化的领导者,利用其与车辆无关的虚拟驾驶员技术开发商业可行和可持续的商业模式 [4] - 公司成立于2016年,业务已扩展至中国、欧洲、东亚、中东等地区 [4] 咨询联系方式 - 投资者和媒体咨询可联系公司投资者关系邮箱ir@pony.ai或Christensen Advisory邮箱pony@christensencomms.com [5]
秋招正当时!自动驾驶之心求职交流群来啦~
自动驾驶之心· 2025-07-28 11:15
行业趋势与人才需求 - 自动驾驶技术栈呈现趋同态势 传统分散的算法工程师需求正被统一技术方案取代 如one model、VLM、VLA等方向 [1] - 行业技术壁垒显著提升 统一方案推动对高阶技术人才的需求 [1] - 从业者普遍存在转型需求 包括传统规控转向大模型、具身智能等新兴领域 [1] 社群运营与行业资源 - 社群定位为综合型行业平台 聚焦自动驾驶产业讨论 涵盖公司动态、产品研发及求职跳槽等核心议题 [1] - 社群目标为整合全行业人才资源 通过交流促进成员职业发展 [1] - 提供产业信息第一手渠道 强化行业人脉网络建设 [1] 人才流动特征 - 校招群体面临实习限制与算力资源短缺等结构性困境 [1] - 资深从业者主动寻求技术方向转型 反映行业技术迭代加速 [1]
传统感知和规控,打算转端到端VLA了...
自动驾驶之心· 2025-07-28 11:15
端到端VLA技术发展现状 - 端到端自动驾驶技术分为一段式与二段式两大方向 一段式包括基于感知(UniAD)、世界模型(OccWorld)、扩散模型(DiffusionDrive)等子领域 二段式以PLUTO为代表 [2] - 基于VLM的方法推动自动驾驶进入大模型时代 形成VLA(Vision-Language-Action)新方向 传统BEV感知、多传感器融合等技术已相对成熟 学术界研究热点明显转移 [2] - 工业界仍在优化传统感知规划方案 但学术界研究资源已集中投向大模型与VLA领域 该领域存在大量待探索的子方向 [2] VLA科研辅导课程设计 - 课程采用"2+1"多师制 主导师由名校教授/行业专家担任 配备科研班主任全程督导 包含12周在线科研+2周论文指导+10周维护期 [11][14] - 提供完整科研闭环支持:从经典/前沿论文分析(PLUTO/UniAD等)、baseline代码(VAD/DiffusionDrive等开源项目)、数据集(nuScenes/Waymo)到论文写作投稿全流程 [8][18] - 硬件要求最低配置4张NVIDIA 4090显卡 推荐8张 支持云服务器租赁方案 [12] 目标学员与课程产出 - 面向本硕博学生 需掌握Python/PyTorch基础 通过1v1面试考核 课程包含先修课强化深度学习与自动驾驶算法基础 [6][12] - 学员将获得:论文初稿(含导师定制idea)、结业证书、推荐信(优秀者) 以及系统的科研方法论与coding能力提升 [11][15] - 解决三大核心痛点:知识碎片化问题(建立VLA体系)、动手能力差问题(复现SOTA模型)、论文写作障碍(提供写作模板与投稿策略) [7] 技术资源支持 - 开源框架覆盖主流技术路线:基于模仿学习(UniAD/VAD)、扩散模型(DiffusionDrive/OccNet)、VLA(OpenDriveVLA/SimLingo)等 [18] - 必读论文包括Senna(视觉语言模型与自动驾驶桥接)、ORION(语言指令生成行动框架)等5篇顶会前沿研究 [18] - 采用腾讯会议直播+小鹅通回放形式 提供6个月答疑周期 严格学术诚信要求(剽窃零容忍) [14][20][21]
自驾一边是大量岗位,一遍是招不到人,太魔幻了......
自动驾驶之心· 2025-07-26 10:39
自动驾驶行业现状 - 自动驾驶行业进入理性发展阶段,资本更加谨慎,公司首要目标是"活下去"和"跑通商业模式"[2] - 行业预计在未来1-3年将经历深度调整和洗牌[2] - 技术栈虽完备但距离大规模商业化落地仍有差距,实验室效果与真实路况表现存在工程鸿沟[3] 人才供需矛盾 - 行业出现"岗位虚位以待但人才难觅"现象,企业对顶尖人才和高度适配人才需求达到前所未有的高度[2][4] - 3-5年经验岗位薪资可达百万级别[2] - 求职者需具备过硬技术能力且适配前沿研究和量产方向[3] 技术社区发展 - 自动驾驶之心知识星球已成为国内最大自驾技术社区,拥有4000名成员和100+行业专家[7][9] - 社区提供30+自动驾驶技术学习路线,覆盖感知、定位、规划控制等几乎所有子方向[9][69] - 与数十家自动驾驶公司建立内推渠道,简历可直接送达[10][67] 前沿技术方向 - 视觉大语言模型(VLM)成为研究热点,涉及预训练、迁移学习、知识蒸馏等多个技术领域[15][16][17] - 世界模型在自动驾驶中的应用日益广泛,如HERMES、DriveWorld等模型实现3D场景理解和生成[34][36] - 扩散模型在自动驾驶视频生成、数据增强等方面发挥重要作用[37][43] - 端到端自动驾驶成为重要研究方向,涉及感知、预测、规划等多个环节[31][49][52] 技术应用与数据集 - 自动驾驶数据集涵盖2D/3D目标检测、语义分割、目标跟踪等多个任务[25] - 语言增强的自动驾驶系统数据集快速发展,支持自然语言导航和空间推理等高级功能[26] - 智能交通领域应用包括车辆检索、视觉问答等实际场景[27] - 自动驾驶感知技术应用于行人检测、3D目标检测等具体任务[28] 行业挑战与解决方案 - 远距离Occupancy检测效果不佳,可能由激光雷达稀疏和监督真值空洞导致[100][101] - 地下车库自动泊车通过视觉传感器和建图技术实现定位[96] - 3D目标检测研究趋于成熟,建议从BEV感知入手学习前沿算法[96]
Investor Reaction To Predictable Mobileye Earnings Was Negative: Analyst
Benzinga· 2025-07-26 02:34
财务表现 - 公司2025财年第二季度营收同比增长15%至5.06亿美元,超出分析师预期的4.6326亿美元 [1] - 调整后每股收益13美分,高于分析师预期的9美分 [1] - 上调2025财年营收指引至17.65亿-18.85亿美元(此前为16.9亿-18.1亿美元),高于分析师预期的17.7亿美元 [2] - 调整后运营收入指引上调至2.1亿-2.86亿美元(此前为1.75亿-2.6亿美元) [2] - 第二季度调整后毛利率达68.6%,略高于分析师预期的68.4% [6] - 运营费用低于预期为2.41亿美元,推动调整后运营收入达1.06亿美元 [6] 产品与业务 - EyeQ芯片出货量上调至3350万-3550万单位(此前为3200万-3400万),SuperVision预计达4万台(此前为2万+) [5][10] - 第二季度EyeQ芯片出货量约970万单位,超出分析师预期的900万单位 [6] - 2027年被视为收入加速关键点,预计将有超过19款车型搭载Chauffeur和SuperVision系统 [7] - 自动驾驶出行服务(AMaaS)预计2027年贡献1.5亿美元收入,ADAS收入或达20亿美元 [8] 市场与合作伙伴 - 与大众(MOIA)、HOLON、优步、Lyft及欧洲公共交通运营商建立合作 [9] - 为ID Buzz机器人出租车提供运营技术和客户软件 [9] - Waymo在旧金山25%的市场份额支持行业整体前景 [9] - 极氪009和Polestar 4车型推动短期增长,奥迪和保时捷预计2026年底开始量产 [10] 未来规划 - 计划2026年底在美国和欧洲多个城市全面部署Drive平台 [8] - 远程操作预计2025年启动,无人驾驶服务计划2026年推出 [9] - 第三季度毛利率预计68.2%,虽低于第二季度但仍高于市场预期 [5] - 分析师认为第四季度营收存在上行空间,因管理层指引较保守 [4][11]
小马智行开启7×24小时自动驾驶测试:「不眠模式」破解城市夜归难题
IPO早知道· 2025-07-25 21:15
自动驾驶政策突破 - 公司在北京、广州、深圳三城开启7×24小时全天候自动驾驶测试,测试时段从原本早7点至晚23点扩充至全天24小时 [2] - 全天候开放测试是北京、广州、深圳在自动驾驶政策上的重要创新和突破 [2] - 凌晨公共交通运力通常不到日间的30%,公司通过部署自动驾驶技术在全场景、全时段的测试和研发,探索自动驾驶出行在夜间时段的实用场景 [2] 技术实力与数据积累 - 公司在北上广深及海外等多个城市已累积超5000万公里的自动驾驶测试里程 [4] - 公司拥有全行业领先的50万小时全无人运营的经验 [4] - 公司L4级自动驾驶软硬件系统采用多传感器融合技术方案,搭载多颗高性能128线激光雷达、800万像素摄像头、4D成像毫米波雷达 [4] - 公司自研传感器自清洁方案可解决水滴、雾气、脏污导致感知精度下降的难题 [5] 技术优势与安全性能 - 公司"AI司机"能够完美规避由于夜间光线不足、视野受限、驾驶员容易疲劳等带来行车风险 [4] - 公司在最具挑战的暗光条件下也能保证对于周围360°环境的实时识别,感知能力远胜过人类 [4] - 公司自动驾驶车辆可实现从车身盲区到最远650米范围内道路、标识以及车辆、行人等通用障碍物持续稳定且准确的检测 [5] 商业价值与社会影响 - 公司第七代自动驾驶车辆在北上广深规模化落地,这套"不眠系统"正在重塑城市运行逻辑 [7] - 公司将持续挖掘自动驾驶出行服务的商业潜能和社会价值,丰富人们的出行选择,释放夜间生产力 [7] - 全天候服务自动驾驶车辆将成为城市的"守护者",改善深夜出行难的问题 [7]
传统的感知被嫌弃,VLA逐渐成为新秀......
自动驾驶之心· 2025-07-25 16:17
端到端自动驾驶技术发展 - 端到端自动驾驶分为一段式端到端和二段式端到端两大技术方向 [1] - 二段式端到端以PLUTO为代表,专注于模型实现自车规划 [1] - 一段式端到端包括UniAD(基于感知)、OccWorld(基于世界模型)、DiffusionDrive(基于扩散模型)等不同流派 [1] - 基于VLM的方法推动自动驾驶VLA方向,开启大模型时代下的端到端研究 [1] - 传统BEV感知、车道线、Occupancy等研究方向在顶会中逐渐减少 [1] 学术界与工业界研究方向差异 - 工业界仍在优化传统感知、规划方案 [1] - 学术界转向大模型与VLA方向,为新兴研究领域 [1] - 新领域对初学者门槛较高,仅少数科研强者可独立产出 [1] - 论文研究方向建议优先考虑大模型、VLA领域 [1] VLA科研论文辅导课题 - 课程目标包括系统掌握VLA理论体系、提升动手能力、论文写作与投稿方法 [6] - 招生对象涵盖本硕博学生、留学申请者、自动驾驶从业者等 [7] - 课程收获包括经典与前沿论文分析、创新点挖掘、实验方法、写作投稿技巧 [8] - 硬件要求最低4张4090显卡,建议8张或租赁云服务器 [11] - 基础要求包括Python、PyTorch、Linux开发能力 [11] 课程结构与支持 - 12周在线科研+2周论文指导+10周维护期 [10] - 提供导师定制idea、baseline代码、数据集支持 [10][14][15] - 采用"2+1"多师制,含主导师与班主任全程跟踪 [13] - 学习阶段包括基础测试、个性化教学、学术回顾等 [13] - 产出包括论文初稿、结业证书、推荐信(优秀学员) [13] 学习资源与安排 - 提供开源代码库(UniAD、DiffusionDrive、OpenDriveVLA等) [14] - 必读论文涵盖VLA模型综述、Senna、SimLingo等前沿研究 [16] - 数据集采用nuScenes、Waymo、Argoverse等公开资源 [15] - 学习要求包括课前阅读、按时作业、全勤参与、学术诚信 [13]
基于3DGS和Diffusion的自动驾驶闭环仿真论文总结
自动驾驶之心· 2025-07-24 17:42
自动驾驶仿真技术发展 核心技术框架 - 自动驾驶仿真器由场景渲染、场景外推、3D资产重建、Relighting、智能体、天气系统等模块构成,通过闭环模拟实现高真实感[1] - 静态环境建模采用3D Gaussian Splatting与Diffusion Model技术,可还原城市细节至路边奶茶杯级别[1] 关键技术突破 静态环境构建 - OmniRe、Street Gaussians、ReconDreamer、StreetCrafter等方案实现高精度3D场景重建,支持逼真城市建模[1] 动态资产采集 - 通过环视采集系统提取汽车、行人、动物等动态元素,MADrive与3DRealCar技术实现复杂场景对象抠像[2] 视觉渲染优化 - R3D2与DiPIR技术完成动态资产重打光,模拟清晨/黄昏/暴雨等复杂光照条件,确保毛发反光等细节真实[2] 智能体行为模拟 - BehaviorGPT、SMART、DFTO-FW等模型赋予资产自主决策能力,支持变道不打灯、行人拍照等拟人行为[4][8] 环境系统增强 - Weather-Magician与RainyGS实现动态天气模拟,可生成雨雪雾霾等极端条件,测试传感器失效场景[4][9] 行业应用与测试场景 极端场景模拟 - 构建"外卖小哥+快递电瓶车+遛狗大妈+抛洒钉子"的复合挑战场景,验证自动驾驶系统鲁棒性[4] 技术验证方向 - 覆盖传感器失效(雨刮罢工、摄像头模糊)、感知干扰(激光雷达雾霾衰减)等30+技术栈测试需求[6][9] 行业生态发展 技术社区规模 - 形成4000人规模的专业社区,吸引300+企业与科研机构参与,覆盖感知、定位、规划控制全技术链[6] 技术培训体系 - 提供端到端自动驾驶、BEV感知、多传感器融合等30+方向课程,包含CUDA部署、轨迹预测等实战内容[6][8][10]
端到端自动驾驶万字长文总结
自动驾驶之心· 2025-07-23 17:56
端到端自动驾驶算法研究背景 - 传统自动驾驶算法采用模块化流程:感知→预测→规划,每个模块输入输出不同,存在误差累积问题且感知信息存在损失[3][5] - 端到端算法直接输入原始传感器数据并输出路径点,避免了模块间误差传递,但面临可解释性差和优化困难等挑战[3][7] - 传统算法优势在于调试便捷和可解释性,而端到端方法在信息完整性方面表现更优[3] 端到端算法技术范式与挑战 - 当前主流采用模仿学习框架,包括行为克隆和逆优化控制两种方法,但难以处理corner case且真值数据存在噪声[7][8] - 评估方法分为开环(固定场景)和闭环(动态交互)两种,因果混淆现象是典型挑战[8] - 技术难点还包括输入模态多样性、多任务学习、知识蒸馏及安全保证等问题[8] ST-P3算法实现细节 - 采用时空学习框架,明确设计感知/预测/规划三模块,创新点包括自车中心累积对齐和双路预测机制[10][11] - 感知模块通过LSS范式生成BEV空间表征,考虑RO/PG角不为零的情况并进行时序融合[13] - 规划阶段引入红绿灯编码优化轨迹,代价函数综合距离/加速度/终点偏差等指标[14][15][16] UniAD系统架构 - 全Transformer框架以规划为导向,包含MapFormer/MotionFormer/OccFormer/Planner等模块[23] - 创新性引入五个代理任务提升性能,通过TrackFormer实现动态Agent跟踪[25][26] - 规划模块整合转向灯信号和自车特征,基于碰撞优化输出最终轨迹[31] 矢量化方法VAD - 将栅格表征转为矢量形式保持几何特性,计算速度优势明显[32] - 通过Map Query/Agent Query分别预测地图矢量和运动矢量,与自车状态交互完成规划[33] - 引入三类约束条件:碰撞约束/边界距离约束/方向约束,通过成本抑制机制优化[38][39][40] 概率化表征方法 - 采用概率分布替代确定性轨迹,解决多模态场景下的折中轨迹问题[42] - 离散化动作空间为4096种规划token,通过场景交互选择最优概率轨迹[43] - GenAD工作采用VAE式生成建模,训练时学习轨迹分布,推理时采样生成[44][46] 多模态规划进展 - 英伟达研究结合多模态规划与多模型学习,增加基于规则的教师模型蒸馏损失[49][52] - 监督信号涵盖无责任碰撞/可行驶区域合规/驾驶舒适性等指标[52] - 当前技术仍受限于数据驱动特性,对异常案例处理能力有待提升[53]