Workflow
Autonomous Driving
icon
搜索文档
实车验证AlignDrive:端到端的横纵向对齐规划(西交&地平线)
自动驾驶之心· 2026-01-09 14:32
文章核心观点 - 提出了一种名为AlignDrive的新型端到端自动驾驶规划框架,其核心创新在于采用级联结构,使纵向规划依赖于横向路径,从而解决了传统并行规划中横向与纵向难以协调、静态信息冗余编码的问题,并显著提升了对动态场景的交互建模能力 [3] - 该框架解锁了一种面向规划的数据增强手段,通过插入虚拟动态智能体并仅调整沿固定横向路径的纵向位移,能够高效生成大量安全关键场景的训练数据,从而提升模型的避碰能力和闭环规划稳健性 [4][6] - 实验表明,AlignDrive在Bench2Drive闭环评估中全面超越先前所有模型,在驾驶得分、成功率等关键指标上大幅领先;在nuScenes开环评估中碰撞率显著降低;其轻量化版本在保持性能领先的同时实现了更高的推理效率 [11][14][17] 方法概述 - AlignDrive采用级联框架:首先预测横向行驶路径,然后以此路径为先验,结合动态环境信息预测沿该路径的等时间间隔一维纵向位移,最终生成自车轨迹 [3][9] - 该设计使不同模块专注于关键信息:横向路径预测模块(类比“转方向盘”)和纵向位移预测模块(类比“踩油门和刹车”) [3] - 训练中引入了面向规划的数据增强模块,通过在检测结果中插入虚拟动态智能体并相应修改自车目标轨迹,来生成更多关键场景的训练数据 [8] 实验与性能评估 - **Bench2Drive闭环评估**:AlignDrive的驾驶能力综合得分(Mean Ability)达到70.06%,显著超越之前的SOTA模型HiP-AD(65.98%)及其他基准模型,在并道(Merging, 75.00%)、超车(Overtaking, 75.56%)、紧急制动(Emergency Brake, 75.00%)等多个子任务上表现优异 [11][13] - **nuScenes开环评估**:AlignDrive在碰撞率(Collision Rate)指标上表现最佳,平均碰撞率为0.06%,低于VAD-Base(0.21%)、DriveTransformer-Large(0.07%)等模型;其轨迹误差(L2)平均为0.78米,略高于其他方案,但文章指出L2指标与真实实车驾驶表现的一致性较差 [14][15][16] - **推理效率**:AlignDrive的轻量化小型版本(AlignDrive-Small)在保持闭环得分领先的同时,实现了更高的推理效率(具体数据因表格不完整未完全呈现) [17][18] - **消融实验**:实验验证了级联规划(LP)、沿路径位移回归(DP)和规划导向数据增强(DA)三个核心组件的有效性,完整模型(E)取得了最高的驾驶得分(89.07)、成功率(73.18%)和最低的碰撞率(11.4%) [19][20] - **数据增强参数**:研究发现,以10%的概率在训练中进行规划导向的数据增强效果最佳 [21] 技术优势与影响 - 通过将纵向规划建模为沿固定横向路径的一维位移回归,自然强化了目标轨迹与动态物体之间的耦合关系,使模型持续聚焦于关键的动态交互信息 [24] - 基于级联框架的数据增强策略,能在不改变横向路径的前提下,高效生成大量高风险场景,极大提升了模型在复杂交通环境中的决策能力与安全性 [24] - 可视化案例表明,传统基线方法因横纵向规划不一致可能导致碰撞,而AlignDrive的级联规划在此类场景下能成功避免碰撞 [22]
Momenta智驾方案解析
自动驾驶之心· 2026-01-09 08:47
Momenta无地图自动驾驶解决方案概述 - 公司提出了一种不依赖高精地图的自动驾驶解决方案,通过多传感器融合与实时环境感知实现导航[4] - 该方案通过数据采集、感知处理、定位计算、路径规划与控制等步骤实现完整自动驾驶功能[4] - 系统使用多摄像头、激光雷达、雷达、IMU、轮速传感器和GNSS接收器进行360度环境感知,其中多摄像头提供视野,激光雷达和雷达提供用于构建3D环境模型的点云数据[5] - 感知模块运用计算机视觉和深度学习算法进行物体检测、分类和跟踪,并融合多传感器数据生成实时更新的局部地图,包含可行驶区域、车道线和障碍物位置[5] - 定位模块融合IMU、轮速和GNSS数据,通过SLAM等算法计算车辆在"Boot Frame"中的精确姿态,在无地图模式下主要依赖传感器融合和实时环境特征匹配[5] - 规划模块根据导航系统提供的全局路线和局部地图生成详细行驶轨迹,并考虑交通规则、障碍物避让和乘客舒适度,其所需的SD Map仅包含基本道路拓扑信息,降低了对高精度细节数据的依赖[5] DDLD(数据驱动地标检测)系统 - DDLD是一种基于数据驱动方法的地标检测系统,用于自动驾驶中道路元素的自动识别与定位[8] - 系统采用以自车为中心的感知框架,将自车作为坐标系原点来检测周围环境[9] - 系统分层检测三类主要地标:车道中心线、车道边界和道路边界,同时还能检测停止线、人行横道等其他道路标记[10] - 检测输出为一系列的点集或贝塞尔曲线参数,直接描述地标的几何形状[29] - 整个系统构成一个庞大的数据飞轮和自动化流水线,旨在低成本、高效率地获取海量高精度标注数据[14] DDLD系统工作流程 - 第一阶段为DDLD地图生产(初始地图构建):派遣专业测绘车进行多次数据采集,采集数据包括多摄像头视频、高精度轨迹和语义点云[18] - 通过多行程重建将同一路段多次采集的数据进行融合,构建更完整精确的环境模型[18] - 在重建的融合数据上运行训练好的DDLD检测模型,离线检测所有地标,以追求更高精度[18] - 经过人工质检后,生成带有时空信息的高精度"DDLD地图"作为系统产出的真值[15] - 第二阶段为自动标注流水线(数据飞轮循环):量产车在路测和日常行驶中不断收集新的行程数据[17] - 系统判断新行驶路径是否已被现有DDLD地图覆盖,这是一个关键决策点[25] - 若路径已被覆盖,系统执行高精度重定位,以厘米级精度确定车辆在地图中的位置,并将地图中存储的地标矢量反向投影到新采集的数据中,从而自动生成完美标注,无需人工干预[25] - 若路径未被覆盖,数据则被送回第一阶段的DDLD地图生产流水线,以扩展地图覆盖范围[19] DDLD模型架构 - 模型架构包括特征提取(编码阶段)、查询与解码(解码阶段)以及预测头(输出阶段)[22][23][28] - 特征提取阶段包含图像编码器和可选的地图编码器,图像编码器使用主干网络或视觉Transformer从原始图像中提取视觉特征,地图编码器允许模型融合上下文先验知识[26] - 图像特征和可选的地图特征会被融合,形成统一的"Map Feature"作为解码器的上下文信息[22] - 解码阶段使用一组可学习的查询,而非传统的锚框或非极大值抑制[23] - 模型预设三组不同的查询:车道图查询、车道边界查询和道路边界查询,用于预测不同类别的结构[30] - 通过Transformer解码器层的交叉注意力机制,每个查询从特征图中收集相关信息,并经过迭代优化[30] - 优化后的查询被送入对应的预测头(车道图头、车道边界头、道路边界头),解码为具体的结构化输出[30] 深度学习规划(DLP)方案 - 针对传统规划方法(如基于优化的方法易陷入局部最小值,基于搜索的方法计算复杂度高)的局限性,公司提出了深度学习规划作为更高效的解决方案[32][33] - 规划被描述为一个高维动作空间中的时空联合搜索问题,传统规划器因在线计算资源有限而不得不牺牲最优性[35] - DLP系统的输入包括五类关键信息:全局路径信息、自车历史轨迹信息与用户设置、历史交通灯信息、静态地标(车道中心线/边界/道路边界)以及动态目标的历史轨迹信息[36][38] - 系统的输出包括两部分:为自车规划的轨迹点、预测的其他交通参与者轨迹点,以及高级驾驶行为决策[36][37] - 驾驶行为决策被建模为分类问题,使用softmax分类输出车道选择得分,使用sigmoid分类输出绕行得分等二元决策置信度[38] - DLP模型架构包含多模态感知信息整合输入层、Transformer编码器进行多模态特征编码、以及Transformer解码器进行决策与轨迹生成[41] - 模型通过生成式预训练、模仿学习和强化学习相结合的方式进行训练[47] 数据闭环与管道 - 公司构建了强大的自动化数据生产流水线来确保深度学习模型的数据质量[44] - 针对数据不平衡问题,采用细粒度挖掘数据管道,从海量数据中主动挖掘稀有但重要的场景(如紧急切入、行人突然闯入)[45] - 针对仿真中的数据分布漂移问题,采用仿真事件生成数据管道,当模型在仿真中犯错时自动生成带有正确标签的新数据以加入训练集[45] - 针对冲突数据(标注错误或矛盾),采用坏数据过滤数据管道,使用规则或噪声检测模型识别并过滤低质量数据[45] - 针对数据匮乏问题,采用仿真事件生成数据管道,利用仿真器大规模生成现实世界中罕见的长尾场景数据[45] - 基础数据质量过滤管道执行最基本的清洗,过滤掉格式错误、数据缺失或明显超出物理极限的无效数据[48] - 细粒度挖掘管道根据场景复杂性、罕见性或模型不确定性,从日志数据中筛选高价值片段供模型重点学习[49] - 坏数据过滤管道识别并移除内部不一致的数据样本以保证数据集纯净度[54] - 仿真真值生成管道在仿真中使用更强大的规划器或专家规则生成最优轨迹作为场景的真值标签[54] - 仿真事件生成管道通过调整参数或使用对抗学习技术,主动生成能暴露当前规划模型弱点的边缘案例场景[54] Cut-In场景效果验证 - 选择"Cut-In"(其他车辆切入)场景进行重点测试,因其高动态性和决策冲突能有效验证深度学习规划方案解决传统框架痛点的能力[53] - 评估指标分为安全指标与舒适指标两大类[53] - 安全指标包括"每次干预的计数"(平均每次人类接管前模型成功处理Cut-In的次数)和"成功率"(模型未发生碰撞且无需接管的比例)[55] - 舒适指标包括"每次问题的计数"(平均每次出现舒适性问题的间隔)和"成功率"(未引发不舒适急刹等行为的比例)[59] - 构建了三个针对性数据集:包含常规车辆切入场景的CutIn数据集、包含各种卡车/挂车切入场景的卡车/挂车CutIn数据集、以及包含与Cut-In相似但无需强烈制动事件的误刹数据集[59] - 实验结果显示,在常规切入数据集上,DLP方法的"每次干预的计数"为33.3,成功率为97%,相比传统方法(9.9 / 90%)有显著提升[58] - 在卡车/挂车切入数据集上,DLP方法的"每次干预的计数"为25.0,成功率为96%,相比传统方法(7.0 / 86%)提升更为明显[61] - 在误刹数据集上,DLP方法的"每次问题的计数"为4.2,成功率为76%,相比传统方法(2.0 / 50%)在舒适性上实现了巨大进步[61] - DLP在安全性上可靠性大幅提升,"每次干预的计数"提升了约2.3到3.4倍,在更具挑战性的卡车/挂车切入场景中成功率提升10个百分点[65] - DLP在舒适性上实现了质的飞跃,成功率从50%提升至76%,"每次问题的计数"翻倍,减少了约一半的不必要急刹车,驾驶行为更拟人化[65] DDPF(数据驱动位姿融合)定位技术 - DDPF是自动驾驶定位模块的核心组成部分,属于底层状态估计,负责输出车辆短时间内的精确运动变化和相对于地面的姿态[66] - 输入来自车辆底盘和惯性传感器的原始时序信号,包括IMU(提供三轴加速度和角速度)、轮速脉冲、转向角和电机速度[69] - 输出包括相对位姿变化(旋转矩阵变化ΔR和平移向量变化Δt)以及绝对地面姿态角(滚转角和俯仰角)[69] - 作为数据驱动方法,DDPF的优势在于能从海量数据中学习真实的传感器误差模型、处理非线性与标定误差、具有更强鲁棒性,并进行端到端优化[69] - DDPF旨在解决传感器固有缺陷(如IMU噪声与漂移、轮速传感器在极低速下失效)、复杂运动学建模困难(如车辆侧滑、停车大侧滑角)以及工程部署难题(为不同传感器组合手动调参)[70][74] - 通过学习真实运动响应,DDPF能处理包括大侧滑角在内的复杂车辆动态,并实现一套模型适配多套传感器,减少部署调参工作量[75] DDPF网络架构与评估 - 网络采用多传感器并行编码设计,为陀螺仪、加速度计、轮速、车轮角度等信号设计独立的编码器进行特征提取[76][79] - 特征融合阶段需要解决不同采样率信号的时间对齐问题,并学习不同模态特征间的互补关系[77] - 融合后的特征通过解码网络处理,最终以回归形式输出6自由度位姿(位置和姿态)[77] - 架构设计具有模态专用性、端到端学习、能处理非线性与依赖关系以及适应复杂运动学等优势[79] - 使用相对位置误差(RPE)评估定位性能,通过比较真值轨迹和模型轨迹在等长段上的相对位移向量来揭示系统在动态运动中的漂移或尺度偏差[82][86] 自动驾驶技术演进路径 - Algorithm 2.0阶段为模块化数据驱动感知,感知任务被拆分为独立的数据驱动模块,规划则基于规则[90][92] - Algorithm 3.0阶段为感知序列任务整合,将与时序相关的感知任务(融合、跟踪、预测)整合成统一的端到端数据驱动模型,规划开始向数据驱动演进[90][92] - Algorithm 4.0阶段为全感知任务整合,将所有感知任务整合进一个统一的4D感知模型,规划实现全数据驱动并能处理复杂认知任务[90][92] - Algorithm 5.0阶段为感知与规划大一统,将感知与规划整合进单一的数据驱动模型,实现从原始传感器数据直接输出驾驶动作或轨迹的端到端系统[90][92] - 技术路径的关键转变包括:从任务独立模块逐步整合为端到端系统、从规则驱动转变为数据驱动、从输出环境感知表征演变为直接输出行动决策[97] - 随着系统整合,评估重点从早期的底层感知指标(如RPE)转向更高层的规划质量(如舒适性、安全性)[97]
Neumann Advisory Cuts Loose Pony AI Shares Worth $23.2 Million, According to Recent SEC Filing
Yahoo Finance· 2026-01-08 23:48
公司股权变动 - Neumann Advisory Hong Kong Ltd 于2026年1月7日完全清仓了其在Pony AI Inc的持股 共处置1,031,880股 [3][4] - 此次交易估计价值为2321万美元 基于季度平均股价计算 导致该基金在季度末对Pony AI Inc已无持仓 [3][4] - 该基金此前持仓占其管理资产规模的5.9% 此次清仓发出了其从该自动驾驶公司撤出的明确信号 [1][4] 公司股价表现 - 截至2026年1月7日 公司股价为17.12美元 过去一年上涨12.2% 但表现落后标普500指数2.15个百分点 [2] - 自2024年11月上市以来 股价波动剧烈 最大涨幅曾达100% 最大回撤超过82% 总体自上市以来上涨41% [4] 公司业务与运营 - Pony AI Inc 是一家专注于自动驾驶技术的公司 业务遍及中美两国 [1] - 公司提供机器人卡车服务、自动驾驶出租车服务、自动驾驶工程解决方案以及智能驾驶软件产品 [1] - 公司在中国市场拥有约1000辆自动驾驶出租车 在北京、上海、广州和深圳四个主要城市运营 [5] - 公司计划在未来一年将业务拓展至八个国家 包括新加坡和卡塔尔 [5] 公司财务状况 - 公司过去12个月营收仅为7500万美元 规模非常有限 [6] - 同期公司净亏损超过2.75亿美元 远未实现盈利 [6] - 公司被定位为一家投机性的初创公司 仅适合激进的成长型投资者考虑 [6]
Mobileye Stock Pops on $900 Million Mentee Acquisition
Schaeffers Investment Research· 2026-01-08 00:16
公司重大战略收购 - 公司宣布以约9亿美元现金加股票的交易收购人形机器人初创公司Mentee [1] - 此次收购标志着公司首次进军其所谓的“实体人工智能”领域 [1] - 交易预计在2026年第一季度完成 [1] 股价与市场表现 - 新闻发布后,公司股价一度飙升至14.33美元,随后交易于12.18美元附近,接近盈亏平衡点 [1] - 股价正从2023年12月18日创下的10.04美元历史低点反弹 [2] - 自2026年初以来,股价已上涨17.4%,并连续第三个交易日上涨 [2] - 200日移动均线附近的熟悉阻力位似乎正在抑制涨幅 [2] 期权市场活动 - 看涨期权交易活跃,今日迄今已交易44,000份看涨期权,是日内平均交易量的15倍 [3] - 看跌期权交易量为9,046份 [3] - 最受欢迎的合约为2026年1月16日到期、行权价为15美元的看涨期权,其次是同系列行权价为14美元的看涨期权 [3] - 在周度1月9日到期、行权价为13美元的看涨期权上有新头寸开立 [3] 卖空与轧空情况 - 今日部分早盘涨幅可能归因于空头回补 [4] - 尽管空头头寸已在减少,但其仍占公司股票流通量的13.5% [4] - 以公司的平均交易速度计算,空头需要超过4天时间才能平仓 [4]
Stock Market Today: Dow Futures Rise, S&P 500, Nasdaq Drops As Street Awaits Slew Of Economic Releases — AAR, Mobileye, Penguin Solutions In Focus - SPDR S&P 500 (ARCA:SPY)
Benzinga· 2026-01-07 18:06
市场整体表现与预期 - 美国股指期货在周三开盘前涨跌互现 道指期货微涨0.04% 标普500期货下跌0.10% 纳斯达克100期货下跌0.26% 罗素2000期货微涨0.02% [1][2] - 主要跟踪ETF在盘前交易中表现不一 SPDR S&P 500 ETF Trust下跌0.11%至691.08美元 而Invesco QQQ Trust ETF上涨0.29%至621.83美元 [2] - 周二美股主要指数收高 道琼斯工业平均指数上涨约1%至49,462.08点 创下历史新高 标普500指数上涨0.62%至6,944.82点 纳斯达克综合指数上涨0.65%至23,547.17点 罗素2000指数上涨1.37%至2,582.90点 [1][10] 宏观经济与政策 - 投资者关注周三将发布的一系列经济数据 包括ADP就业报告、ISM服务业指数、职位空缺数据以及工厂订单数据 [1][14] - 美联储副主席米歇尔·鲍曼将于美国东部时间下午4:10发表讲话 [16] - 根据CME FedWatch工具 市场预计美联储在1月维持当前利率不变的可能性为83.9% [2] - 关键国债收益率方面 10年期美债收益率为4.15% 2年期美债收益率为3.46% [2] 行业与板块动态 - 周二标普500指数中 材料、医疗保健和工业股涨幅最大 而能源和通信服务板块逆势收跌 [9] 重点公司动态 - **AAR Corp** 股价在盘前上涨5.07% 公司第二季度业绩超预期 并对本季度给出强劲销售指引 预计第三季度销售额在8.1384亿至8.27404亿美元之间 高于市场预期的7.93438亿美元 [6] - **Penguin Solutions Inc** 股价在盘前上涨4.41% 公司第一季度财务业绩超预期 [6] - **Mobileye Global Inc** 股价在盘前大涨11% 公司已达成最终协议 将以约9亿美元收购以人工智能为先的人形机器人公司Mentee Robotics 旨在将其自动驾驶技术与Mentee的机器人平台相结合 以引领“物理AI”市场 [6] - **Ventyx Biosciences Inc** 股价在盘前飙升67.76% 有报道称礼来公司正就以超过10亿美元收购该公司进行深入谈判 [6] - **Constellation Brands Inc** 股价在盘前上涨0.50% 分析师预计该公司将在收盘后公布季度每股收益为2.64美元 营收为21.6亿美元 [15] 大宗商品与加密货币 - 纽约早盘交易中 原油期货下跌1.02% 至每桶56.55美元左右 [17] - 黄金现货价格下跌0.70% 至每盎司4,463.46美元左右 其上一个历史高点为每盎司4,550.11美元 [17] - 比特币价格下跌1.74% 至每枚91,732.77美元 [17] 全球市场概览 - 亚洲市场周三收盘涨跌互现 韩国KOSPI指数和澳大利亚ASX 200指数上涨 中国沪深300指数、日本日经225指数、香港恒生指数和印度Nifty 50指数下跌 [18] - 欧洲市场在早盘交易中普遍走高 [18] 机构观点与策略 - 贝莱德对2026年保持积极展望 主张采取“风险偏好”立场 其驱动力是结构性转变而非传统宏观经济指标 [11] - 在2025年美国股市录得16.6%的强劲涨幅后 该公司预计美股将持续走强 支撑因素包括“强劲的企业盈利(部分由AI主题驱动)”以及美联储进一步的宽松政策 [11] - 贝莱德指出三个指导其2026年战略的关键经验 第一 “不可改变的经济规律”将限制政策的极端性 第二 “超级力量 尤其是占主导地位的AI 胜过传统宏观因素” 鼓励投资者忽略短期波动 [12] - 因此 贝莱德对美国及日本股票保持超配观点 将AI视为结构性转型的驱动力 [12] - 经济方面 贝莱德预计数据前景将更加清晰 在近期的噪音之后 有望获得“对劳动力市场和通胀更清晰的解读” [13]
Mobileye将以9亿美元收购机器人公司Mentee Robotics
格隆汇APP· 2026-01-07 10:00
收购交易概述 - 自动驾驶技术公司Mobileye将以现金加股票的方式收购以色列人形机器人初创公司Mentee Robotics [1] - 交易总价值为9亿美元 [1] - 交易预计于今年第一季完成 [1] 交易结构与对价 - 交易对价包括6.12亿美元现金 [1] - 交易对价还包括最多26,229,700股Mobileye A类普通股 [1]
不止昆仑芯,李彦宏最该放权的还有萝卜快跑
36氪· 2026-01-06 17:34
文章核心观点 - 百度旗下AI芯片公司昆仑芯已提交港股上市申请,此举引发市场对百度另一核心业务“萝卜快跑”未来是否也会分拆上市的广泛猜测与讨论 [1][2] - 文章通过分析认为,将昆仑芯、萝卜快跑等创新业务分拆独立上市,是解决百度集团整体估值被严重低估、释放业务价值、并应对内部管理挑战的关键战略路径 [5][12][16] - 文章论证了业务分拆有助于百度实现价值回归,让市场对创新业务进行独立估值,同时也能激发组织活力,吸引和留住顶尖人才 [12][17][32] 昆仑芯上市与市场反应 - 昆仑芯科技有限公司已于1月1日以保密形式向香港联交所提交主板上市申请表格(A1表格) [1] - 该消息公布后,百度港股股价在1月2日当天大幅上涨9.35% [2] - 市场兴奋的原因之一是国内芯片概念股受到热捧,而昆仑芯被认为是国产AI芯片出货量第二的公司,因此备受期待 [2] 萝卜快跑业务现状与分拆预期 - 萝卜快跑是百度自动驾驶出行服务业务,截至2025年10月已进入全球22座城市,在欧洲、中东及中国香港市场取得重大进展 [4] - 截至2025年11月,萝卜快跑累计服务订单量已超过1700万单 [4] - 百度创始人李彦宏在2025年第三季度财报电话会上透露,萝卜快跑已在少数城市实现正向单位经济效益,并预计2026年将有更多城市达成此目标 [4] - 同业公司如小马智行、文远知行已完成上市,这加剧了市场对萝卜快跑是否也会分拆上市的猜测 [4][20] 百度业务板块估值分析 - **在线营销业务**:假设2025年广告收入约635亿元人民币,净利润率25%,以5倍市盈率保守估算,该业务估值约为114亿美元 [5] - **AI云业务**:2025年前三季度营收193.3亿元人民币,同比增长31%,预估全年收入260亿元人民币(约37亿美元),按7倍市销率估算,估值约为259亿美元 [6] - **自动驾驶业务(萝卜快跑)**:保守估计2025年收入20亿元人民币(约2.8亿美元),按25倍市销率估算,对应估值70亿美元;若参考Waymo估值,则可能达到400亿美元 [6] - **芯片业务(昆仑芯)**:假设2025年收入预期与寒武纪相当,按9亿美元营收及20倍市销率估算,保守估值约为180亿美元 [7] - **爱奇艺及其他业务**:估值之和约80亿美元 [8] - **现金及短期投资**:百度账上至少有超过178亿美元的现金及短期投资 [9] - **估值总结**:上述各部分保守估值加总,百度合理估值线应在881亿美元以上,但截至2026年1月5日收盘,其美股市值仅为514.56亿美元,处于被严重低估状态 [9] 分拆独立上市的原因分析 - **原因一:释放价值与重估** 创新业务如芯片、云、自动驾驶在集团内常被视为“负估值”或资产负担,分拆后可独立定价,避免传统业务放缓拖累整体估值,并切割局部业务风险 [10][11][12] - **原因二:历史经验验证** 百度历史上分拆业务如度小满、作业帮取得了成功,而未能充分独立或分拆的业务如小度科技、百度健康则发展受挫或市场存在感减弱,提供了正反两方面的经验教训 [13][14][15][16] - **原因三:治理与激励优化** 分拆有助于治疗“大公司病”,打破内部协同壁垒,通过独立决策和股权激励等方式解放生产力,吸引和留住顶尖人才,这对于处于市场上升期的业务至关重要 [16][17][18][32] 萝卜快跑分拆上市的紧迫性与优势 - **竞争环境** 竞争对手小马智行、文远知行已上市并获得资本追捧,萝卜快跑作为能力更强的参与者,需要及时行动以维持士气和竞争力 [20][21] - **决策与人才** 分拆后萝卜快跑将获得决策独立性,有利于在快速迭代的自动驾驶竞争中抢占时间窗口,并通过股权激励吸引顶尖人才,构建技术护城河 [21] - **融资备战** 参考2025年本地生活大战中各方投入超千亿元人民币,未来网约车与Robotaxi可能爆发“打车大战”,萝卜快跑需趁资本热潮上市融资,储备“无限火力”以应对长期竞争 [26][27] - **战略定心丸** 百度过去常被诟病战略摇摆,萝卜快跑成功分拆上市能给资本市场吃下定心丸,证明其战略决心 [28][29] - **人才与治理** 百度曾是自动驾驶“黄埔军校”,但多位核心人才出走,分拆独立可能通过充分放权,解决内部管理阻力,最大化发挥人才能动性 [30][31][32][33][34]
开年收到了很多同学关于自驾方向选择的咨询......
自动驾驶之心· 2026-01-06 17:17
自动驾驶领域学术研究趋势与方向 - 行业观察到自动驾驶领域的研究方向呈现前沿与差异化并存的格局 前沿方向包括视觉语言模型、端到端自动驾驶、强化学习、3D高斯泼溅和世界模型[2] 相对竞争较少的赛道包括开集目标检测、占据网络以及小样本/零样本学习[2] - 针对不同专业背景的研究者 行业建议采用差异化的学习路径 计算机和自动化背景的研究者更适合深度学习相关的前沿方向 如视觉语言模型、端到端和世界模型 因其在职业和学术发展上空间广阔[2] 机械和车辆背景的研究者则建议从传统规划与控制、3D高斯泼溅等方向入手 这些方向对算力要求较低且更易入门[2] - 行业普遍认为 研究能力的提升依赖于持续的方法论训练 包括大量阅读论文、积极交流并逐步形成独立的思考和创意[2] 论文辅导服务覆盖的研究方向 - 公司提供的论文辅导服务覆盖了自动驾驶领域广泛的研究与技术方向[3] 核心感知方向包括端到端模型、视觉语言模型、3D目标检测、BEV感知、占据网络、语义分割、轨迹预测、单目感知以及车道线与在线高精地图构建[3] - 服务同时涵盖规划控制与前沿模型技术 具体包括运动规划、强化学习、扩散模型、流匹配[3] 在多模态融合与特定传感器领域 服务涉及多传感器融合、点云感知和毫米波雷达感知[3] - 其他支持的研究方向还包括3D高斯泼溅和多任务学习[3] 论文辅导服务内容与成果 - 公司提供的核心服务包括论文选题、论文全流程指导以及实验指导[6] - 服务延伸至博士申请指导领域[7] - 公司宣称其中稿率很高 并有大量论文被顶级会议和期刊收录 包括CVPR、AAAI、ECCV、CoRL、ICLR、IROS、ICRA、ACL等[7] 论文辅导服务的目标发表渠道 - 公司辅导的论文目标发表渠道涵盖自动驾驶领域的顶级会议 包括CCF-A、CCF-B、CCF-C等级别的会议[10] - 目标期刊包括SCI一区至四区 以及中科院分区的一区至四区期刊[10] - 服务也支持EI检索期刊、中文核心期刊的发表 并覆盖毕业设计论文、博士申请以及竞赛相关的论文需求[10]
简历直推 | 清华大学全国重点实验室招聘工程师/博后/实习生(世界模型/重建/感知等)
自动驾驶之心· 2026-01-06 14:52
清华大学智能绿色车辆与交通全国重点实验室招聘信息 - 清华大学智能绿色车辆与交通全国重点实验室正在招聘工程师、博士后及实习生,招聘岗位涉及自动驾驶车端世界模型、路侧数据重建车端数据、智能网联感知算法及AI共性功能模块库软件等多个前沿方向 [1] 自动驾驶车端世界模型方向 - **岗位目标**:面向端到端自动驾驶核心技术需求,从事车端世界模型的研究与工程化落地,构建融合物理先验、时序一致性与行为预测能力的世界模型架构,以支撑自动驾驶系统的感知、预测、规划一体化能力建设 [3] - **核心职责**:包括研究与开发车端世界模型核心架构,构建驾驶场景时空表征与预测模型,研发基于Transformer、Diffusion、Neural Fields等前沿架构的场景生成与仿真模型,设计多模态输入融合方案,以及完成世界模型在车端平台的部署优化 [6] - **次要职责**:包括搭建模型评估体系,开展模型压缩、量化、推理加速等工程优化,跟踪世界模型前沿进展,以及协助团队完成技术文档撰写与学术论文产出 [6] - **任职要求**:要求计算机、人工智能等相关专业硕士及以上学历,熟悉Transformer、Diffusion Models等时序建模与生成式架构,熟练掌握PyTorch并具备大规模模型训练经验,熟悉自动驾驶相关技术栈,有世界模型、行为预测等相关研究或车端部署经验者优先 [11] 从路侧传感数据重建生成车端传感数据方向 - **岗位目标**:面向车路云一体化场景,从事多模态大模型与生成式算法研究,实现基于路侧传感数据的车端视角重建与生成,研发世界模型核心架构、三维重建与神经渲染系统、多视角生成算法 [9] - **核心职责**:包括研究与复现前沿多模态大模型与生成式算法,设计并研发世界模型核心架构,构建多模态特征融合与对齐体系,研发三维重建与神经渲染系统,以及基于Diffusion Models进行多视角生成与视角修复 [12][13] - **次要职责**:包括搭建统一评估体系与自动化测试框架,开展系统级工程优化与部署,协助团队完成技术文档撰写与学术论文产出,以及配合团队开展技术研讨交流 [18] - **任职要求**:要求计算机、人工智能等相关专业硕士及以上学历,熟悉Transformer、Diffusion Models、NeRF/3DGS等前沿生成式与三维重建算法,熟练掌握PyTorch并具备大规模模型训练经验,具备多模态数据处理经验,有VLM/世界模型或NeRF/3DGS实际项目经验者优先 [18] 智能网联自动驾驶感知算法方向 - **岗位目标**:面向智能网联自动驾驶感知系统核心需求,从事BEV感知算法研发与嵌入式部署工作,涵盖障碍物检测、车道线识别、红绿灯与交通标识识别等关键感知任务,并完成感知模型在Orin平台的高效推理部署 [17] - **核心职责**:包括负责BEV感知算法的研发与优化,完成感知模型在Orin平台的模型转换与C++推理部署,负责感知模块的ROS Topic数据收发与系统集成,以及承担多类传感器的数据解析与驱动开发 [22] - **次要职责**:包括负责ROS各节点的调度与系统集成,参与感知结果与交通流的可视化平台开发,协助团队完成技术文档撰写,以及配合团队开展感知系统的测试验证 [19][22] - **任职要求**:要求计算机、车辆工程等相关专业硕士及以上学历,熟悉主流深度学习框架并具备BEV感知、目标检测等算法开发经验,熟练掌握C++编程并具备TensorRT/ONNX模型转换与嵌入式推理部署经验,熟悉ROS/ROS2开发并具备多传感器数据处理经验,有Orin等嵌入式平台或实车感知系统开发经验者优先 [22] 分层解耦AI共性功能模块库软件方向 - **岗位目标**:面向智能网联自动驾驶AI算法工程化需求,从事分层解耦的AI共性功能模块库设计与开发,构建模块化、组件化、可扩展的算法组件体系,并研发图形化开发系统与可视化工具链,以提升算法开发效率与系统集成能力 [21] - **核心职责**:包括负责分层解耦的AI模块库设计与开发,研发图形化开发系统与可视化工具链,负责前后端整体架构设计与开发,以及与算法团队协作完成算法封装与系统集成 [23][24] - **次要职责**:包括优化工具链性能与用户体验,编写技术文档与接口规范,协助团队完成平台演示与对外展示,以及配合团队开展系统测试与问题排查 [23] - **任职要求**:要求计算机、软件工程等相关专业硕士及以上学历,熟练掌握前端与后端至少一类技术栈,理解软件架构设计、模块化开发与系统工程化,熟悉可视化技术或图形化流程引擎,有工具链平台、工作流系统或低代码平台开发经验者优先 [24] 通用应聘信息 - **所需材料**:所有岗位均要求提供个人简历和代表性成果支撑材料 [8][16][20][23] - **应聘方式**:所有岗位的应聘材料均需打包发送至指定邮箱 `helei2023@tsinghua.edu.cn`,邮件主题需注明“岗位名称+应聘人员姓名” [8][16][20][23]
Seyond to Showcase Live RoboVan Demonstrations and Next-Generation LiDAR at CES 2026
Globenewswire· 2026-01-05 20:00
公司核心动态 - 公司Seyond在CES 2026展会期间于LVCC西馆6059号展位展示其激光雷达解决方案[1] - 公司展位设计为互动式双层体验 重点展示可部署的激光雷达如何赋能当前汽车、机器人和智能基础设施领域的真实世界自动驾驶[2] - 公司参展核心信息是:真实世界的自动驾驶需要经过验证、可扩展的感知能力 公司通过可部署的激光雷达平台、灵活的系统架构和完整的感知产品组合 使客户能够自信地构建和部署感知解决方案[3] 产品与技术展示 - 公司展台的核心展品是来自自动驾驶技术全球领导者Zelostech的Z5 RoboVan 该车是全球最早实现“全球RoboVan运营”的L4级自动驾驶企业产品[4] - Z5 RoboVan集成了公司的激光雷达技术 展示了高性能感知如何成为真实世界自动驾驶车辆平台的设计核心 通过车载传感器集成和实时数据可视化 参观者可了解激光雷达如何为物流、最后一英里配送和商用自动驾驶应用实现精确环境感知、态势感知和安全决策[5] - 该展示说明了可部署的激光雷达如何支持可扩展的自动驾驶平台 弥合了原型概念与量产意向车辆系统之间的差距[6] - 公司现场演示其最新激光雷达平台 包括专为大规模生产设计的全固态激光雷达Hummingbird 以及其长距激光雷达系列的最新演进产品Robin E1X[7] - 通过现场传感器演示和实时点云可视化 参观者可以看到Hummingbird如何为汽车和机器人应用提供紧凑、宽视场的感知 而Robin E1X则为自动驾驶、智慧城市和工业自动化提供了增强的探测距离、改进的点云质量和优化的性能[8] - 这些演示共同说明了公司的激光雷达技术在实际操作环境中的表现 而不仅仅是在受控的实验室环境中[8] 公司业务与定位 - 公司是全球先进的激光雷达解决方案提供商 专注于汽车、机器人和智能基础设施应用 其技术致力于在不同操作环境中实现真实世界的自动驾驶[9] - 公司致力于通过下一代3D传感技术 加速安全、智能和互联系统的普及[9]