自动驾驶
搜索文档
广州车展直击——如祺出行:“高效运营+高质数据”加速自动驾驶技术量产应用
36氪· 2025-11-21 18:58
行业趋势:车企合作与Robotaxi商业化 - 2025广州车展显示车企与科技公司合作成为标配,行业正将“智慧出行”理念从产品延伸至场景,探索更广泛的汽车生态合作方式 [2] - 全球Robotaxi行业处于从技术验证迈向大规模商业落地的关键拐点,麦肯锡预测2030年全球市场规模将突破2,800亿美元,中国有望占据近40%份额 [4] - 行业面临成本高、法规滞后、场景复杂等挑战,主要玩家如Waymo、Momenta等纷纷与Uber等出行平台合作以补足运营短板 [4] 公司战略:如祺出行“Robotaxi+”模式 - 公司展示“Robotaxi+”战略,以运营优势为基础,向监管机构、自动驾驶技术公司等提供一揽子解决方案,输出标准化商业模式以加速商业化落地 [2] - 战略计划在未来5年将Robotaxi运营拓展至100个核心城市,与合作伙伴构建超万辆的Robotaxi车队 [5] - 战略同时瞄准Robotaxi商业化后的车后维保刚需,计划未来五年建设超1000个基础设施站点,以支持年运维10万辆Robotaxi车辆 [5] 运营与数据能力 - 公司是国内较早布局自动驾驶商业化的出行企业,2022年推出全球首个有人驾驶网约车与Robotaxi混合运营平台,目前运营Robotaxi超300辆,服务覆盖广州、深圳及横琴,运营站点超过10,000个 [3] - 公司推出“智驾数据采集车”方案,基于量产车改装,在提供网约车服务同时合规采集道路数据,实现“一边赚钱、一边产数”,截至2025年9月已有300余辆采集车在广州运行 [7] - 公司自研数据标注平台使标注效率提升3倍以上,人力依赖降低60%,拥有超1500人专业标注团队,每月交付标注产能超过70万帧,客户包括广汽集团、理想汽车等 [8] 数据服务与未来增长 - 公司通过“规模运营—获取数据—技术迭代—量产应用”的闭环,面向自动驾驶及其他行业提供数据服务,发展“高效运营+优质数据”的双轮驱动模式 [6] - 公司将自动驾驶领域训练的数据能力拓展至医疗、教育、金融等高价值垂直领域,以AI数据服务开辟新增长曲线 [8] - 艾瑞咨询数据显示,2024年中国AI基础数据服务市场规模为58亿元,2028年将达170亿元,年复合增长率高达30.84% [8]
小马智行港股上市累跌37%创新低 募67亿港元首日破发
中国经济网· 2025-11-21 17:25
股价表现 - 公司港股于2025年11月21日收盘报87.10港元,单日跌幅达7.09% [1] - 当日盘中股价最低触及85.60港元,创下上市以来新低 [1] - 自上市以来,公司股价累计下跌37.34%,处于破发状态 [1] 上市首日表现 - 公司于2025年11月6日在港交所上市,开盘即破发,报124.00港元,较发行价下跌10.79% [1] - 上市首日收盘报126.10港元,跌幅为9.28% [1] 发行与募资详情 - 公司港股最终发售价定为每股139.00港元 [1] - 全球发售所得款项总额为67.07亿港元,扣除相关费用后,所得款项净额为64.54亿港元 [1] - 全球发售股份总数为48,249,000股,其中香港发售股份4,195,600股,国际发售股份44,053,400股 [1] 基石投资者 - 公司基石投资者包括Eastspring Investments(Singapore)Limited、Ghisallo Fund Master Ltd、Athos Capital Limited、Hel Ved Master Fund及Ocean Arete Limited [2] - 各基石投资者获分配的发售股份数量分别为1,117,800股、2,794,600股、1,397,300股、838,400股及558,900股 [2]
自动驾驶教父:人形机器人被高估也被低估,空中机器人市场空间将远超地面
华尔街见闻· 2025-11-21 11:15
自动驾驶行业现状与前景 - 自动驾驶技术的“莱特兄弟时刻”已在2005年DARPA挑战赛时发生 目前技术普及率正处于向L4/L5级别全面过渡的拐点 [2] - 人类每年在汽车中度过的时间总计高达8200万年 释放驾驶时间的经济价值巨大 [2] - 在峰会现场约500名与会者中 约有三分之一的人已经乘坐过自动驾驶汽车 其中绝大多数体验的是Waymo [2] 自动驾驶技术路线之争 - 特斯拉在奥斯汀的纯视觉FSD方案如能实现安全的商业化Robotaxi服务 将是巨大成就 并对依赖激光雷达的多传感器融合路线构成成本效率上的严峻挑战 [2][5] - 当前市场对于多传感器融合与纯视觉方案的争论尚未结束 纯视觉方案的低成本优势可能形成降维打击 [2][5] 人形机器人领域评估 - 人形机器人赛道同时存在“过度炒作”和“未被充分重视”的悖论 [3] - 市场对人形机器人替代人类劳动力的总潜在市场规模预期过高 但严重低估了执行开放式任务和实现“灵巧手”的实际工程挑战 [3][5] - 距离真正的通用人形机器人落地仍有巨大技术鸿沟需要跨越 尤其是在物理交互层面 [3] 空中机器人发展前景 - 未来空中机器人的数量将大大超过地面机器人 [4][5][6] - 在3D空间中实现完全自动操作所需的技术已经存在 但限制领域爆发的关键在于基础设施 [6] - 美国的空中交通管制系统急需进行重大改造以适应趋势 这为eVTOL及相关基础设施建设板块提供了长期投资逻辑 [5][6] 行业整体发展阶段 - 尽管投资者感到焦虑 但科学仅解决了1%的问题 99%仍待探索 [5] - 自动驾驶正处于从L4向L5过渡的边缘 [2][5]
何同学称今年公司亏损百万;蚂蚁回应灵光与千问竞争丨新鲜早科技
21世纪经济报道· 2025-11-21 11:09
巨头公司动态 - 何同学公司因个人品牌形象受损导致今年亏损一两百万 [1] - 魅族科技回应出售总部大楼传闻 称租期很长不会搬迁 [2] - 蚂蚁集团CTO表示灵光App与阿里千问是共赴AGI的战友兄弟关系 [2] - 人工智能先驱杨立昆将离开Meta并创办新公司 Meta计划与其初创公司合作 [2] - 新东方董事长俞敏洪回应南极全员信争议 计划明年邀请20名优秀员工和会员赴南极 [3] - 联想集团CEO杨元庆宣布明年1月6日将在全球推出个人超级智能体 [3] 行业政策与展望 - 广东省提出加强算力产业新供给 打造全国集成电路第三极 [4] - 2025年中国芯片设计产业销售额预计达8357.3亿元 同比增长29.4% [4] - 2025年预计831家芯片设计企业销售额超过1亿元 [4] 企业财报表现 - 英伟达CFO表示公司正朝着今明两年AI芯片收入5000亿美元目标推进 [5] - 网易第三季度营收284亿元 净利润95亿元 游戏及相关增值服务净收入233亿元 [5] - 联想集团第二财季营收1464亿元创新高 同比增长15% 净利润36.6亿元同比增长25% [6] - 联想个人电脑市场份额史上首次超过25% [6] - 斗鱼第三季度营收8.991亿元 净利润1133万元同比增长232.8% 调整后净利润2314万元扭亏为盈 [7] 资本市场与融资 - 新生纪智能完成超亿元A轮融资 由高瓴创投领投 [8] - 领益智造向港交所提交上市申请书 [9] 科技创新与产品 - 文远知行Robotaxi获得瑞士纯无人牌照 计划2026年上半年向公众开放服务 [9]
文远知行Robotaxi获得瑞士纯无人牌照,至此已累计获得八国自动驾驶牌照
IPO早知道· 2025-11-21 10:04
公司核心里程碑 - 文远知行于11月20日获得瑞士联邦公路局颁发的纯无人Robotaxi牌照 获准在苏黎世州弗尔塔尔地区公共道路上开展纯无人运营 这是瑞士首张纯无人Robotaxi牌照 [2] - 公司成为全球唯一同时拥有瑞士、中国、阿联酋、沙特阿拉伯、新加坡、法国、比利时和美国八国自动驾驶牌照的科技公司 标志着全球化战略布局的重要进展 [3] 瑞士业务运营规划 - 文远知行Robotaxi将作为iamo智能自动化出行试点项目的重要组成部分开展纯无人商业运营 该项目由瑞士公共交通实验室牵头 旨在探索将自动驾驶车辆整合进公共交通系统 [3] - 运营区域约为110公里 沿途设有约460个停靠点 最高时速可达80公里/小时 [3] - 计划于2026年上半年正式向瑞士公众开放Robotaxi纯无人运营服务 并逐步将自动驾驶小巴Robobus纳入运营车队 打造瑞士首个由Robotaxi与Robobus组成的混合自动驾驶车队 [6] 测试与准备阶段 - 公司与当地驾校合作开展由安全员随车的自动驾驶测试 测试覆盖弗尔塔尔多个区域 包括Boppelsen、Otelfingen等 在不同交通与天气条件下进行多轮适应性测试 [4] - 在与瑞士联邦公路局顺利完成测试后 将启动纯无人驾驶测试 由瑞士最大的私营巴士运营商Eurobus在中央支持中心进行远程监测 [6] 现有业务基础 - 自2025年6月起 文远知行自动驾驶小巴Robobus为苏黎世机场员工提供往返总部与维修区的接驳服务 [6] - 2025年10月 公司与苏黎世机场启动了自动驾驶小巴后排安全员及远程驾驶舱的操作培训 为后续纯无人运营做准备 [6]
轻舟智航:计划2026年上半年在宁波投放数百台无人物流车
每日经济新闻· 2025-11-21 09:55
合作与战略规划 - 轻舟智航与浙江金邮供应链技术服务有限公司正式签署战略合作协议[1] - 双方共同推动L4级无人物流车在宁波的开放道路上实现规模化商用[1] 运营与部署计划 - 计划于2025年内在宁波实现多条无人物流标杆线路的常态化运营[1] - 运营重点为承接网点与驿站之间的货物收派与转运任务[1] - 计划于2026年上半年内投放数百台无人物流车[1]
工业界算法专家带队!面向落地的端到端自动驾驶小班课
自动驾驶之心· 2025-11-21 08:04
端到端自动驾驶技术行业需求与挑战 - 端到端技术已成为车企量产核心招聘岗位 但市场上面向量产的真正人才极为稀缺[1] - 端到端岗位要求全栈能力 涵盖模型优化 场景优化 数据优化以及下游规划兜底等多个环节[1] - 行业当前需攻克导航信息引入 强化学习调优 轨迹建模与优化等量产一线难题[3] 端到端量产课程核心内容 - 课程设计历时三个月 聚焦从实战到落地的进阶内容[3] - 核心算法覆盖一段式端到端 两段式端到端 导航信息量产应用 开闭环强化学习 扩散模型+强化学习 自回归+强化学习 时空联合规划等[5] - 课程重点在于面向就业与直击落地 仅开放35个招生名额[5] 课程详细大纲 - 第一章:介绍感知模型一体化架构与规控学习化方案 分析任务合并与模块设计[10] - 第二章:讲解两段式框架建模 感知与PNC信息传递 优缺点 并以PLUTO算法实战[11] - 第三章:分析一段式框架优势 学习VLA VAD等基于diffusion的方法 实现信息无损传递[12] - 第四章:解析导航地图格式 内容 及其在端到端模型中的编码与嵌入方式[13] - 第五章:从模仿学习过渡到强化学习 讲解RL算法及训练策略以解决场景泛化问题[14] - 第六章:进行nn planner项目实战 结合模仿学习与强化学习 涵盖扩散模型与自回归算法[15] - 第七章:介绍时空联合规划等轨迹平滑优化算法 作为模型输出不准时的兜底方案[16] - 第八章:分享数据 模型 场景 规则等多视角的量产经验 提升系统能力边界[17] 课程师资与安排 - 讲师王路拥有C9本科及QS50 PhD背景 发表多篇CCF-A/B论文 现任国内顶级Tier1算法专家 具备大模型 世界模型等前沿算法预研与量产经验[6] - 课程面向具备BEV感知 视觉Transformer 强化学习 扩散模型 Python/PyTorch等基础的进阶学员 需自备4090及以上算力GPU[18][19] - 课程采用离线视频教学 辅以VIP群答疑及三次线上答疑 自11月30日开课 预计三个月结课 按周解锁各章节内容[20]
NeurIPS'25 | 博世最新D2GS:无需LiDAR的自驾场景重建方案
自动驾驶之心· 2025-11-21 08:04
技术方案核心 - 提出D²GS框架 一种无需激光雷达的城市场景重建方法 旨在解决传统方案对激光雷达的依赖及其带来的标定和投影误差问题 [3][6] - 通过多视图深度初始化高斯点云 并在训练过程中交替优化3DGS场景和深度估计结果 实现与激光雷达效果相当但更密集精确的几何先验 [3][6] - 该方法在无需LiDAR的前提下达到了SOTA的重建效果 [6] 行业技术挑战 - 当前城市场景重建方法通常依赖多模态传感器输入 如激光雷达和图像 但获取精确激光雷达数据存在挑战 [3] - 挑战包括需要进行激光雷达与其他传感器间的精确时空标定 以及因安装位置不同导致的空间未对准和重投影误差 [3] 技术应用与专家背景 - 分享嘉宾为博世创新软件中心的三维重建算法专家 专注于自动驾驶场景重建算法 [8] - 技术核心涉及3DGS和Depth估计的交替优化以及深度补全模型 [8]
驭势科技 | 规划算法工程师招聘(可直推)
自动驾驶之心· 2025-11-21 08:04
自动驾驶行业技术趋势 - 视觉语言动作模型成为行业焦点,小鹏汽车已官宣VLA2.0版本,工业界正推进该技术的量产落地[14] - 技术路线存在争论,前几个月曾出现世界模型和VLA路线之争,显示出技术方向尚在快速演进中[14] - 端到端自动驾驶是另一重要发展方向,与VLA共同代表行业前沿技术路线[14] 自动驾驶关键技术研究 - 3D高斯泼溅技术受到关注,其与3D目标检测结合可用于生成动态仿真场景,DriveStudio是自动驾驶领域的相关资源库[13] - 香港中文大学(深圳)联合滴滴提出UniSplat方法,这是一种基于3D潜在支架的时空统一融合方法,旨在实现动态驾驶场景的高效重建[14] - 规划算法核心技术包括混合A*、Lattice、QP、MPC等路径规划方法,并需结合车辆运动学、动力学建模知识[7] 行业人才需求与流动 - 驭势科技在北京房山招聘规划算法工程师,职责是研发满足复杂场景要求的无人驾驶轨迹规划算法[3][4] - 自动驾驶领域存在显著的人才跨行业流动现象,例如有从业者从国有银行转行至自动驾驶大厂,后又加入创业公司和新势力企业[13] - 企业对算法工程师的任职要求包括丰富的Linux系统下C/C++编程经验,并优先考虑学历背景优秀或具有智能驾驶大厂背景的候选人[7] 专业社区与知识分享 - 自动驾驶之心知识星球是行业技术交流和求职内推的重要平台,提供技术进展和行业动态[10] - 该平台定期举办“自驾圆桌”和“星友面对面”活动,例如2025年11月19日第四期活动嘉宾为香港高校博士生,研究方向涵盖BEV感知、VLA和多模态RAG等前沿技术[13] - 社区内活跃讨论具体技术问题,例如博士开题方向选择,涉及3D目标检测与3DGS结合的可行性探讨[13]
自动驾驶三大技术路线:端到端、VLA、世界模型
自动驾驶之心· 2025-11-21 08:04
文章核心观点 - 行业当前致力于解决安全且经济的 corner case 问题 [1] - 技术路线存在三大核心争议:单车智能与智能网联、视觉与激光雷达传感器、模块化与端到端算法架构 [1] - AI决策领域呈现VLM、VLA、WA(去LLM)三种主流技术路径分化,代表企业分别为Waymo、特斯拉/吉利/小鹏、华为 [1] - 自动驾驶技术演进遵循从规则系统到数据驱动,再到认知建模的路径 [3] 技术演进与架构 分阶段模块化架构 - 传统架构划分为感知(定位)、预测、规划、控制五大独立模块 [5] - 感知模块负责处理图像与点云数据,完成目标检测与地图分割任务 [5] - 定位模块融合GPS、IMU及地图匹配技术以确定车辆精确位置 [5] - 预测模块在几何空间内运行,预测周围环境未来状态(如车辆轨迹) [5] - 规划模块结合导航与感知信息,在有限时间内生成安全舒适的可行驶轨迹 [5] - 控制模块精确执行油门、刹车及转向指令 [5] BEV与OCC感知技术 - BEV感知于2022年成为主流,OCC感知于2023年兴起 [3] - BEV核心价值在于统一多传感器数据的表征空间,解决信息融合根本问题 [14] - BEV优势包括天然适配动态/静态感知、快速替代传统检测方案、99%常规场景可收敛 [15] - BEV缺陷体现在非结构化场景与超复杂路口(150米+)存在瓶颈,暴露纯几何表征天花板 [15] - OCC占用网络提供时间维、空间维及不确定性数据,优于仅提供目标检测的BEV [6] - 为解决BEV高度信息缺失及LSS投影缺陷(离散稀疏、不连贯、无容错),行业引入3DGS技术 [16][17] - 3DGS通过"软投影"特性实现连续致密特征、平滑过渡及容错能力,提升BEV感知质量 [18][19] 端到端自动驾驶 定义与分类 - 端到端系统定义为从传感器原始输入到任务变量输出的完全可微过程 [20][22] - 狭义端到端指传感器数据直接输出规划/控制动作或行驶轨迹 [22] - 技术演进分为四个阶段:感知端到端、决策规划模型化、模块化端到端、One Model单一模型端到端 [31] - 模块化端到端(华为、小鹏、理想采用)实现感知与规划模块的梯度协同训练,接口基于特征向量 [31] - One Model端到端(特斯拉采用)采用单一深度学习模型直接映射原始信号至轨迹输出 [31] 优势与挑战 - 端到端本质是实现感知信息的无损传递,通过梯度反传实现全局优化 [22][25] - 传统分阶段架构问题在于各模块独立优化导致的阶段目标不一致、误差累积及计算负担 [27] - 端到端面临可解释性悖论(性能提升但安全性可解释性降低)、数据规模与质量要求高、长尾场景覆盖度不足三大挑战 [27][28] - 决策层技术路线包括模仿学习(快速获得基础能力但泛化性不足)与强化学习(学得鲁棒策略但依赖仿真环境) [29] VLM、VLA与WA技术路径 VLM(视觉语言模型) - VLM让AI负责环境理解与推理,最终决策权交由传统模块以确保过程可控,代表企业为Waymo [1][35] - 技术流程为环境信息输入→VLM→推理链/多任务→非直接控制输出,运行频率低(2-5 Hz) [36] - VLM能够解释复杂交通场景并提升系统可解释性,但存在"行动鸿沟",即语言输出与实际控制脱节 [36] - 输入数据包括视觉输入(多摄像头图像、BEV特征图)、Prompt指令、导航指令及用户指令 [36] VLA(视觉语言动作模型) - VLA试图让AI直接学习所有驾驶技巧,通过海量数据训练实现"端到端"决策,代表企业为特斯拉、吉利、小鹏 [1][39] - 技术流程为环境信息输入→多模态编码器→LLM/VLM→动作解码器→驾驶动作,形成感知推理行动闭环 [40] - 语言输入演进历经直接导航指令、环境查询、任务级指令至对话式推理四个阶段 [42] - 动作解码器可采用自回归令牌器、扩散模型头或分层控制器生成控制信号或轨迹点序列 [42] - 小鹏第二代VLA为商业应用代表,技术发展历经语言模型作为解释器、模块化VLA、统一端到端VLA、推理增强VLA四个阶段 [44][48] WA(世界动作模型)与路线之争 - 华为ADS 4采用WEWA架构(世界引擎+世界动作模型),强调无需语言组件,直接建立时空认知能力 [1][52][55] - WEWA架构核心逻辑为视觉直接映射动作,跳过语言转化环节,关键指标为端到端时延降低50%、重刹率降低30% [56] - VLA架构核心逻辑为视觉-语言-动作三级传导,以语言为中介,优势在于复杂场景决策准确率提升及支持自然语言交互 [56] - 语言模型价值在于跨场景知识迁移能力(如预训练模型规划误差降低27.12%)、多模态信息统一表征及决策可解释性 [57] - 技术路线核心差异在于是否依赖语言抽象,VLA依赖语言模型归类场景,而WEWA主张直接学习时空物理规律 [55][57]