自动驾驶
搜索文档
中国智能驾驶国际化加速 轻舟智航海外多个市场落地
中国经济网· 2026-01-14 17:55
公司合作与市场拓展 - 轻舟智航作为国内领先的辅助驾驶解决方案提供商,凭借成熟的量产经验和经过市场验证的技术,成为极石汽车拓展海外市场的关键伙伴 [1] - 极石汽车与轻舟智航深度合作,可显著降低其海外车型的辅助驾驶系统研发成本与部署周期 [4] - 双方联手拓展海外市场被视为一种双赢的战略选择 [4] 轻舟智航业务与技术实力 - 轻舟智航的辅助驾驶产品搭载量已近百万台,在中国乘用车NOA市场中占有率稳居行业前列 [1] - 公司的技术方案已通过近百万国内用户和复杂场景验证,在匝道通行、拥堵路段处理、路口通过等关键场景中表现出高可靠性与高通过率 [4] - 轻舟智航正快速将中国的辅助驾驶技术落地海外产品,其方案是历经行业头部品牌近百万台智能汽车广泛验证与备受好评的同源成熟方案 [3] 极石汽车产品与市场表现 - 极石ADAMAS于2025年底在国内上市,并已在阿联酋、卡塔尔、沙特、科威特和阿曼五个国家率先上市,海外售价超过8万美元 [3] - 极石ADAMAS在智能化配置上,首次全系标配基于轻舟智航辅助驾驶系统的L2+级智能驾驶功能,涵盖高速、城区及泊车功能 [3] - 极石ADAMAS单月订单突破2000台,12月单月销量达到2528台,全年交付突破1.5万辆,增长至上年的近3倍 [3] - 极石品牌已成功进入40多个国家市场,形成覆盖中东、中亚、北非等重点区域的销售网络,并连续12个月实现销量稳健增长 [3]
美股异动丨文远出行盘前涨超1% 微信小程序正式上线 机构看好ROBOX商业化落地
格隆汇· 2026-01-14 17:37
公司股价与交易动态 - 文远知行股票于1月13日收盘报8.810美元,下跌0.980美元,跌幅为10.01% [1] - 截至1月14日盘前交易,股价上涨至8.930美元,涨幅为1.36% [1] - 1月13日交易日内,股价最高为9.745美元,最低为8.690美元,振幅达10.78% [1] - 当日成交量为770.56万股,成交额为6899.15万美元 [1] - 公司总市值为30.17亿美元,流通市值为21.21亿美元 [1] 公司业务进展 - 文远知行Robotaxi出行服务小程序“文远出行”正式上线 [1] - 用户无需下载额外应用,可通过微信搜索小程序在广州、北京等运营区域一键呼叫Robotaxi [1] - 此举旨在让用户更便捷地体验无人驾驶出行服务 [1] 行业前景与公司定位 - 东吴证券研报指出,Robotaxi行业正加速迈向商业化拐点,盈利路径清晰 [1] - 文远知行被定位为Robotaxi技术领跑者 [1] - 公司有望受益于政策逐步开放、自动驾驶技术持续突破以及产业链降本 [1] - 在单位经济模型转正后,公司有望快速实现规模化并扭亏为盈 [1]
特斯拉(TSLA.US)FSD大转向:从“买断”全面改为订阅 拟于2月14日后生效
智通财经· 2026-01-14 17:21
公司战略调整 - 特斯拉公司宣布将彻底改变其高级驾驶辅助系统“全自动驾驶”(FSD)的销售模式,计划于2月14日后全面转向月度订阅服务,取消高达约8000美元的一次性买断费用 [1] - 该服务目前月度费用为99美元,此举旨在大幅降低用户体验该技术的初始门槛 [1] - 在面临销售增长乏力的背景下,特斯拉正将其战略重心转向以科技为核心的增长点,如FSD、无人驾驶出租车和机器人业务 [1] 业务与市场现状 - 特斯拉去年已将全球最大电动汽车制造商的头衔让位于中国的比亚迪 [1] - 尽管市场对特斯拉的估值与前景展望已转向其AI技术体系,但特斯拉电动车销量与汽车业务基本面仍是当前现金流与资产负债表的支柱 [1] - 汽车业务也是FSD数据闭环与车队规模的基础,Robotaxi的最终落地也依赖于可规模化的车辆产能与运营 [1] 产品技术说明 - FSD技术目前仍需驾驶员持续监控并随时准备接管,其命名“全自动驾驶”尚未完全实现 [1] - 特斯拉的独家AI超算体系支撑着FSD全自动驾驶、Robotaxi以及名为“擎天柱”的特斯拉AI人形机器人等未来增长点 [1]
图森未来智驾方案解析:感知、定位、规划和数据闭环
自动驾驶之心· 2026-01-14 17:00
整体技术路线 - 核心思想是感知与规控紧耦合,并输出不确定性,感知系统应输出概率分布而非确定性结果[8][10] - 概率化感知输出障碍物的核心特征概率分布,包括位置、速度、大小和类别[11] - 不确定性估计至关重要,它使系统能够量化自身的认知不确定性,从而提前规避风险,对安全决策至关重要[11] - 面临的主要挑战包括算法局限、传感器噪声和环境本质模糊性带来的不可避免的不确定性,以及需要研发能输出概率分布的算法和能利用不确定性信息的规控算法[12][15] 感知系统 - 采用完全稀疏的感知栈,从成熟的二维目标检测出发生成初始“种子”目标,再通过Transformer和稀疏注意力机制收集信息并回归三维检测框[19][20] - 基于物体的多视角3D检测框架在透视视图下操作,无需显式构建BEV空间,通过稀疏注意力进行高效信息聚合[22][26] - 从2D检测框出发的优势在于:利用成熟的检测器框架和高质量易获取的标注数据,实现相机间的冗余互补,并利用图像丰富的语义信息实现高准确度和高召回率[24][27] - 极度压榨目标跟踪带来的时序信息,对同一目标在不同帧的信息进行融合[30] - 激光雷达感知采用稀疏计算,直接使用稀疏卷积,并基于类似聚类的逻辑处理点云,之后进行二阶段精修以补全目标形状[33][35][38] - 通过高度的信息冗余、长时间的观察和远距离感知来应对异常情况,例如使用多个摄像头长时间观察前方500米的路况[41] 定位系统 - 定位是自动驾驶的基石,目标是精确、实时地确定车辆自身的三维位置和三维姿态[46] - 方案核心是多传感器融合,输入传感器包括激光雷达、摄像头、RTK GNSS、IMU、轮速计和高精地图[47] - 算法核心能力是通过概率化方法处理各传感器输入,生成对车辆运动状态的最合理估计,并自动剔除异常值[48] - 两大技术创新点包括:能智能删除异常值的多信源定位融合算法,以及自研的RTK GNSS紧耦合定位方案,后者通过融合原始观测数据提升系统鲁棒性[49][50][53] - 针对卡车的核心挑战是超高精度姿态估计,尤其是偏航角,因为微小误差会被长感知距离急剧放大,例如100米外1°的偏航误差会导致约1.74米的横向偏差[50][53] - 方案达成的关键性能是将用于长距离感知的摄像头的姿态(主要是偏航角)精度控制在0.1°以内,这在100米处仅引入约0.17米的误差[53] 预测系统 - 早期方案包括栅格化表示和矢量化表示两种主流技术路线[58][65] - 栅格化表示将动态轨迹和静态地图信息渲染成多通道的鸟瞰图图像,使用CNN进行编码和预测,其优势是应用相对成熟、对结构化/非结构化道路兼容性好,但主要缺陷是交互信息难以包含在渲染中,且计算成本高[60][62][63][70] - 矢量化表示将地图元素和轨迹表示为矢量,通过图神经网络进行编码,其核心优势是能显式建模交互、数据表征紧凑高效,对结构化特征表达精确[66][71][72] - 公司方案采用一种务实的混合策略,针对不同场景结合两者优势:对于结构化道路主要采用自研的矢量化表示方法,对于非结构化道路则采用栅格化表示作为补充[73][75][77] 规划与控制 - 公司方案的核心是联合预测与规划,在处理高度动态的多车交互时,同时考虑安全性与灵活性[84] - 对于自车的每条规划轨迹,使用博弈论模型预测他车行为的概率,并加入Contingency分支来评估轨迹的安全性,允许自车偏离预定轨迹以应对他车未来的行为[84] - 通过Contingency方案,规划策略本质上考虑了未来多种可能场景下自车的应对措施[85] - 控制策略从开环控制升级为自适应闭环控制,以解决开环控制缺乏鲁棒性的问题[91][92] - 闭环控制的核心是反馈控制器,它实时读取车辆当前状态,与理想轨迹比较并计算出消除误差的控制指令,形成控制闭环[92][93] - 核心升级在于自适应与在线学习,控制器参数可根据实时表现或驾驶模式自动调整,并结合车辆动力学仿真进行在线学习和策略优化[94][95][99] - 该框架构建了一个完整的“感知-决策-控制-学习”闭环,其核心目标是在考虑他车不确定交互、自车物理约束和综合驾驶目标的前提下,通过全局优化找到最优自车控制策略[95][97] - 框架包含概率交互Agent模型、闭环车辆动力学仿真与在线学习、Reward/Cost模型和全局优化器等关键组件[98][100][105] 仿真与数据系统 - 端到端仿真是更高级别的集成测试,是将整个算法系统作为黑盒进行测试的基础[106][107] - 仿真系统架构包括仿真引擎、车辆模型、传感器模拟等,支持真实及人工编辑场景,用于测试整体算法流程[108][109] - 端到端仿真的常见实现包括路测数据回放和虚拟引擎渲染,两者各有优劣[111] - 公司采用轨迹级别的离线自动标注方案,通过双向多目标跟踪和轨迹特征提取,实现“一帧检测,永不丢失”的效果,其标注效果(如3D AP达到90.19)超越了人类标注水平[112][113][116]
关于2026年科技行业的12个关键问答:AI、自动驾驶、机器人、世界模型、美股......
钛媒体APP· 2026-01-14 16:08
AI行业趋势与范式转变 - 2025年行业认知从“是否使用AI”转向“如何使用及投入多少预算”,企业关注点从追求最贵最好的模型转向更实际的小语言模型和本地化微调,以实现垂直行业部署 [2] - 2025年“DeepSeek Moment”标志着大模型开发不再被五大科技巨头垄断,新兴实验室可能实现从0到1的突破,行业呈现去中心化趋势 [3][4] - 2026年AI竞争焦点将从“单纯堆数据”转向“系统级Scaling”,涉及数据策展、系统优化与产品反馈闭环,谷歌因其系统中心型优势而表现突出 [3][6] Scaling Law与模型发展路径 - Scaling Law依然强劲,增长瓶颈不在于数据耗尽,而在于数据精心挑选、清洗与配比,算力集群的细节优化(如连接、容错、带宽)仍有10倍提升空间 [5] - 2026年模型竞争路径分化,纯模型公司面临更大成本压力,行业将对过去“无脑堆数据”的方式进行修正 [6] - 模型“保鲜期”短暂,领先优势可能仅维持6个月,这引发了对大公司是应自研模型还是优先发展应用的战略辩论 [7][9] 科技巨头的AI战略分歧 - Meta面临战略困境,其Llama 4模型表现不及预期,内部在死磕底层模型技术以确保长期独立性,与优先发展应用产品之间存在路线之争 [6][7] - 一种观点认为,像Meta这样体量的公司必须掌控AI底层技术(“电力”),以防像过去被苹果隐私政策制约那样,在AI时代被卡脖子 [7][8][9] - 另一种观点认为,大厂应发挥应用层优势,可通过购买API或等待市场成熟后再布局模型能力,错过一年不会构成生存威胁 [7][9] AI应用落地与投资机会 - 2026年AI应用爆发将主要集中于B端(企业级),特别是在医疗、金融、保险等垂直领域,AI Agent将带来营收级增长,企业采纳速度远超传统SaaS时代 [10] - 摩根大通一家银行的AI预算,超过全球排名前十的其余九家银行的总和,推动其与初创公司的POC验证周期缩短至几周,商业订单签署仅需数月 [10] - 当前明确的AI生产力应用是AI原生编程(Vibe Coding)和AI浏览器,但ChatGPT的“足够好”挤压了利基市场空间,未来杀手级应用需跳出对话框形态,深度融入工作流或硬件 [11] 自动驾驶技术路线与竞争格局 - 旧金山停电事件成为技术分水岭,特斯拉的端到端方案能基于学习人类博弈行为通过无信号路口,而Waymo基于规则的系统则陷入瘫痪,凸显了处理极端情况的能力差异 [12][13] - 特斯拉的算法领先源于其问题驱动的团队文化、放弃激光雷达“置之死地而后生”的勇气,以及软硬件协同设计能力,这些因素共同构成了竞争壁垒 [14][15][21] - Waymo的每英里运营成本为1.43美元,特斯拉约为0.81美元,Waymo成本虽可能下降,但其基于规则的系统及车队维护(如机械激光雷达折旧、人工充电)使其难以达到特斯拉的成本水平,且不具备规模经济效应 [24][25][26] 芯片与算力格局演变 - 投资逻辑正从“纯GPU信仰”转向关注“ASIC效率”及算力集群的瓶颈环节,如带宽,光通讯公司(如博通)的边际变化显著 [3][30][31] - 谷歌凭借TPU的垂直整合优势,在证明其模型能力与更低推理成本后,估值从14倍快速提升至近30倍,与英伟达GPU阵营形成分化 [29][30] - 特斯拉专注于推理芯片的软硬件协同设计,其第四代芯片为规则系统设计,第五代则考虑了端到端和大语言模型需求,而训练芯片项目Dojo因复杂度高及存在英伟达替代选项而失败 [19][20][21][22][23] 美股市场动态与资本逻辑 - 2025年8月17日后市场因子发生剧烈切换,资金从高估值、高质量AI龙头股流向高波动性的周期性行业资产,反映了资金流动逻辑的微妙变化 [28] - AI行业泡沫是否破裂不取决于烧钱规模,而取决于“模型智力每三个月翻倍”的信仰是否持续,只要信仰存在且信贷周期支持,资金流就不会中断 [3][32][33] - 2026年OpenAI的IPO将是关键市场试金石,其能否证明具备系统级入口地位和强商业闭环,将极大影响整个AI板块的估值 [3][33] 宏观风险与投资关注点 - 主要宏观黑天鹅风险可能来自金融条件的突然紧缩,例如日本央行激进加息抽走全球日元流动性,或美国激进财政政策引发债务担忧 [34] - 特朗普提出的约900亿美元返税政策可能刺激消费并重新推高通胀,导致复杂多变的宏观周期,需密切关注PMI和就业市场的边际变化 [34] - 投资应遵循“不要对抗美联储,也不要对抗技术进步的信仰”的原则,在智能密度提升的逻辑中寻找非共识红利 [35]
打开微信叫一辆Robotaxi,「文远出行」小程序上线
格隆汇· 2026-01-14 13:45
公司业务动态 - 文远知行Robotaxi出行服务“文远出行”于1月14日正式上线微信小程序,用户无需下载独立应用,通过微信搜索即可在广州、北京等运营区域呼叫服务[1] - 公司推出小程序旨在以更灵活便捷的方式将自动驾驶服务融入日常生活,利用微信庞大的用户基础和高频使用特性,降低Robotaxi体验门槛,提升用户对技术的认知与信任[24] 产品服务与使用流程 - 用户通过微信搜索“文远出行”小程序,授权手机号一键登录[6] - 系统支持自动定位或手动输入上下车点,确认行程后点击“立即呼叫”即可叫车[9] - 叫车成功后,用户可在地图上实时查看车辆位置、预计到达时间及行驶轨迹[12] - 车辆到达后,用户通过手机解锁上车,并在车内交互屏点击“开始行程”,行程中可通过小程序查看实时路线[20] - 行程结束后,通过小程序可直接跳转至微信支付完成订单支付[24] 市场推广与用户激励活动 - 公司推出“坐文远开年,接好运连连”新年体验活动,时间为2026年1月1日至1月31日,活动地区为广州市黄埔区[24][27] - 活动鼓励用户在小红书、抖音或视频号发布在黄埔区的Robotaxi打车/乘车原创内容并添加指定话题,审核通过后可获得20元京东卡[24][27][30] - 官方将根据点赞数评选20篇优质内容,每位获奖者可获得100元京东卡奖励[27][30] - 公司推出“乘推乘”邀请活动,时间为2025年12月22日至2026年1月30日,邀请人通过专属链接邀请新用户注册,好友可获得“1元打车”体验,邀请人可获得一张“50元无门槛打车神券”[32] - 新用户注册可获得1张1元打车券和2张20元券[34] - 公司通过社交媒体评论区互动,计划抽取6位留言点赞最多的用户赠送专属周边,活动截至1月16日中午12点[34]
CES上的“物理AI”拐点:Robotaxi走向规模化,人形机器人供应链悄然形成
华尔街见闻· 2026-01-14 12:09
核心观点 - 2026年被视为AI大规模进军物理世界的开端,自动驾驶汽车将从测试验证过渡到规模化,人形机器人将从实验室实验转向小规模部署 [1] - 行业焦点正从技术可行性转向规模化能力与成本控制,供应链绑定、产能爬坡与单位成本曲线成为下一阶段关键跟踪指标 [13][14] 自动驾驶 (Robotaxi) 发展态势 - **商业化加速**:2026年被视为自动驾驶商业化加速年,随着特斯拉2025年推出Robotaxi,多家玩家商业化动能增强 [10] - **运营数据验证**:Waymo自成立以来已提供超过1000万次付费乘车,并在2025年12月达到每周45万次付费乘车的节奏,业务已扩张至休斯敦、迈阿密及东京、伦敦等国际市场 [14][15] - **主要玩家动态**: - Waymo与Zoox在CES上大规模存在,显示行业动能强劲 [10] - Mobileye与大众计划在洛杉矶推出基于ID. Buzz的L4级Robotaxi服务 [15] - 由Nuro、Lucid、Uber共同推进的基于Lucid Gravity的自动驾驶车辆计划于2026年末在旧金山湾区启动 [15] - 亚马逊Zoox展示面向密集城市的无传统驾驶舱“车厢式”Robotaxi [15] 人形机器人发展态势 - **发展阶段**:行业正从实验室实验转向小规模部署 [1] - **商业化路径**:短期内,“通用类人机器人”将优先导入具体场景以证明商业可行性,而非直接进入家庭 [8] - **成本下降路径**:降本主要驱动力为规模上量带来的费用摊薄和供应商议价改善 [9] - 有公司称机器人成本已从20万美元降至10万美元,并规划在未来几年降至5万美元,前提是销量达到数千台 [10] - Mobileye披露,在收购Mentee背景下,若年产量达5万台,简化设计的制造成本约为2万美元/台;若年产量达10万台,成本可降至1万美元/台,目标是在2028年实现产能爬坡 [10] - **产能规划**:波士顿动力与现代汽车宣布目标是在2028年实现年产能3万台,且其2026年产量已全部提前分配给现代的汽车工厂 [10] 供应链与关键部件 - **供应链成形**:人形机器人领域正在培育全新的供应链,供应商正试图向该领域转型,路径类似电驱动总成 [1][4] - **执行器成为关键**:执行器被视为机器人的“肌肉”入口,约占波士顿动力机器人物料成本(BoM)的60% [1][10] - 舍弗勒展示一体化行星齿轮执行器,扭矩范围60–250 Nm,且回驱能力低,适合连续工况,已获NEURA采用 [4] - 现代摩比斯将为波士顿动力Atlas供应执行器,意图借助汽车规模化供应链来制造机器人 [4] - **芯片格局**:在机器人机载处理器上,英伟达凭借Jetson Orin或Thor平台仍占据主导,客户包括1X、Agility、Figure AI等众多公司 [3] - 特斯拉与小鹏使用自研推理芯片 [5] - 高通推出面向机器人的下一代全栈架构方案Dragonwing IQ10 Series,但尚未清楚能否获得大规模采用 [5] 技术范式与模型演进 - **从脚本走向Agentic**:最显著的范式变化是从预编程动作转向视觉-语言-动作模型,让机器人能够“推理”完成任务 [3] - Boston Dynamics用Google DeepMind的Gemini Robotics VLA模型替代传统模型预测控制,使Atlas能理解非结构化环境 [3] - **训练数据闭环**:行业争论焦点从“仿真 vs 真实”转为“如何高效实现真实世界数据与仿真的闭环” [7] - NEURA采取“物理优先”路线,建设大型实体训练中心收集高保真数据,再生成“合成孪生”在仿真中训练 [10] - 有公司通过远程操作收集人类示范数据,再用仿真生成超过10万种动作变体进行强化学习 [10] - Mobileye强调其Mentee将基本以仿真来训练 [10] 主要公司产品与战略 - **英伟达**:推出面向自动驾驶的Alpamayo(“大脑”)与Thor(“头骨”)组合方案,旨在降低车企部署高阶能力的门槛 [11] - **Aptiv**:展示下一代端到端AI驱动的ADAS平台,并推出云原生中间件平台LINC,旨在实现软件定义车辆,其传感器技术正向航天与协作机器人领域扩展 [12] - **Visteon**:发布算力达700 TOPS的SmartCore HPC域控制器,并推出插件式AI-ADAS计算模块,方便车企为存量平台升级功能,该产品已应用于中国极氪车型 [13] - **Keenon Robotics**:其服务机器人占据全球40%市场份额,海外累计出口约10万台,产品价格从低于1万到约10万元人民币 [10] - 旗舰类人机器人XMAN-R1可执行爆米花、倒饮料等任务,其VLA模型面向服务业 [10] - 在日本等高人工成本市场,其机器人使用寿命达8年,高于行业常见的3–5年 [10] - **Deep Robotics**:聚焦工业巡检,机器人最高覆盖距离63km,可在危险区域执行24/7自主巡逻,并采用可更换电池设计 [10]
探寻世界模型最优解!SGDrive:层次化世界认知框架,VLA再升级(理想&复旦等)
自动驾驶之心· 2026-01-14 08:48
文章核心观点 - 复旦大学、上海创智学院、理想汽车、同济大学和萨里大学联合提出了一种名为SGDrive的新型自动驾驶框架,该框架通过将结构化和层次化的驾驶世界知识整合到视觉-语言模型中,旨在解决现有端到端方法在复杂场景中缺乏显式因果推理和高层理解的问题,从而提升自动驾驶的安全性和可靠性 [2][3][12][15] 背景回顾 - 端到端自动驾驶技术从UniAD、VAD到SparseDrive不断演进,但缺乏显式因果推理和高层场景理解,在复杂长尾场景中存在局限 [6] - 大语言模型和视觉-语言模型的出现,为整合先验知识和复杂推理能力以缓解传统方法不足提供了可能 [6] - 早期尝试将VLM用于驾驶规划存在局限:直接生成轨迹坐标存在精度损失,而基于扩散模型的解码器方法则未能解决VLM在空间感知、关键信息辨别和未来状态预测方面的根本缺陷 [6][9][10][11] 核心方法:层次化世界认知框架 - **整体设计理念**:SGDrive通过引入一组特殊的世界查询token,引导VLM关注驾驶相关的关键知识并预测其未来演变,从而增强VLM的3D空间感知能力 [15] - **问题定义**:框架建模为两个互补子问题:提取代表性世界知识和预测未来世界状态 [16] - **世界查询编码器**:查询token并非随机初始化,而是通过融合自车状态、历史轨迹和视觉特征进行初始化的“先验感知”查询,能有效捕获场景上下文 [17][20][21] - **层次化世界知识表征**:受人类驾驶认知启发,从三个维度组织知识: - **场景几何布局感知**:专注于感知和预测场景的3D占据结构,回答“位置能否通行”的问题,并使用VAE解码器进行重建,通过重采样策略解决场景稀疏性挑战 [22][23][24] - **安全关键智能体检测**:基于与自车轨迹的交互可能性和可见性,选择性关注可能影响驾驶安全的车辆、行人和骑行者,而非所有对象,并预测其当前和未来的3D状态 [25] - **短期驾驶目标预测**:预测约4秒后的自车目标姿态,为轨迹规划提供高层语义指导,确保驾驶行为的完整性和一致性 [28][30] - **结构化块状注意力掩码**:为防止不同层次知识间的信息泄漏,采用块状注意力机制,允许同类查询互相关注,但禁止跨类别查询互相关注,以保持表征的独立性和准确性 [31][33] - **扩散规划器**:利用扩散Transformer,以学习到的层次化世界知识为条件,从带噪声的初始化中生成平滑、连续的未来轨迹点序列 [34][35] - **两阶段训练策略**: - **阶段一(监督微调)**:训练VLM联合预测视觉问答答案、场景几何、安全关键智能体和短期驾驶目标 [36][37] - **阶段二(扩散规划器训练)**:冻结VLM作为世界模型,专门训练扩散规划器生成轨迹,实现“理解世界”与“生成动作”的解耦 [36][39] 实验结果 - **主要结果**: - 在NAVSIM v1测试集上,基于InternVL3-2B骨干的SGDrive在仅使用相机输入的方法中达到了87.4 PDMS的SOTA性能,超越了更大的通用VLM(如InternVL3-8B)4.1 PDMS,也超越了之前SOTA的驾驶VLM方法Recogdrive-8B 0.6 PDMS [39] - 在关键的碰撞相关指标NC和TTC上取得最佳分数,证明了其安全性 [3][39] - 在与强化学习框架集成后,PDMS进一步提升至91.1,超越所有现有方法 [40] - 在NAVSIM v2测试集上,SGDrive达到86.2 EPDMS,超越之前最先进的ReCogDrive-8B 2.6个百分点,并在安全指标上保持领先 [40][41] - **消融实验**: - **世界知识预测有效性**:仅表征当前多层世界状态使PDMS提升2.5个百分点,增加未来世界预测后性能进一步提升至85.5 PDMS,表明预测未来演变能增强安全意识和规划效率 [42] - **世界查询子成分有效性**:逐步添加场景、智能体、目标和未来状态信息来引导规划器,PDMS从86.0提升至87.4,且安全指标(如NC、TTC)获得改善 [43] - **结构化注意力掩码有效性**:与因果注意力相比,结构化注意力将EP从80.1提升至81.2,整体PDMS从87.1提升至87.4,产生了更清晰的任务特定嵌入和更真实的驾驶行为 [44][45] - **定性结果**: - 与RecogDrive对比显示,SGDrive在复杂交互和弯道场景中能生成更安全、无碰撞的轨迹 [46] - 可视化表明模型预测的层次化世界知识与真值标注高度对齐 [48] - 模型能根据自车运动状态(如直行高速、转弯)自适应调整感知焦点和范围,体现了对驾驶场景的有效理解 [50][51] 结论 - SGDrive框架通过将驾驶理解分解为场景-智能体-目标的层次结构,并预测其未来演化,显式地组织了VLM的表征学习 [52] - 结合结构化注意力掩码和基于DiT的规划器,该方法在NAVSIM基准测试中实现了安全驾驶方面的最先进性能 [52]
百度Apollo Go首个海外控制中心落成
商务部网站· 2026-01-13 23:21
公司业务进展 - 百度Apollo Go在迪拜科学园设立首个海外自动驾驶运营控制中心 [1] - 该中心是公司在中国境外设立的首个同类中心 [1] - 中心将承担车队管理、充电、软件更新及安全测试等运营职能 [1] 行业与市场拓展 - 公司与迪拜道路交通管理局合作共同为控制中心揭幕 [1] - 此举旨在助力迪拜智能交通的发展 [1]
小马智行+北汽新能源合作升级 中东欧洲成新战场
南方都市报· 2026-01-13 23:09
合作升级概览 - 小马智行与北汽新能源宣布达成“五位一体”全面深化战略合作,从单一项目1.0阶段迈入全体系协同的2.0时代 [1] - 合作核心为“产品共创、市场共拓、产业共链、生态共建、资本共融” [1] - 此次合作升级基于双方前期扎实的合作成果,标志着合作进入“从1到N”的新阶段 [1][3] 前期合作成果与进展 - 双方于2024年11月签署技术合作协议,以北汽新能源全冗余底盘架构为基础,深度融合小马智行第七代自动驾驶软硬件系统,联合打造L4级极狐阿尔法T5 Robotaxi车型 [1] - 2025年7月首台量产车下线并启动路测,合作推进速度远超行业预期 [1] - 一个月完成第100台交付,三个月实现300台下线并投入规模化试运营,截至目前累计量产已突破600台 [1] - 自2025年11月起,极狐阿尔法T5 Robotaxi已在北京亦庄、深圳南山及宝安区等核心区域全面上线,覆盖机场、高铁站、商圈及早晚高峰时段,成功打通“量产、测试、运营”的高效闭环 [1] 合作2.0阶段具体规划 - **产品共创**:以极狐阿尔法T5 Robotaxi的成功量产经验为基础,从“单一车型”向“全景谱系”跨越,正向研发更丰富的L4级Robotaxi产品矩阵,同时将验证成熟的技术方案延伸至乘用车市场的高阶智能驾驶车型 [2] - **市场共拓**:除了深耕国内市场,双方还将推动“中国方案”出海,重点布局中东、欧洲市场,实现从车辆到技术标准、运营模式、商业生态的全方位全球化输出 [2] - **生态共建**:北汽新能源将导入集团旗下华夏出行等出行平台及维修、保养、充电等后市场资源,与小马智行的Robotaxi车队深度融合,打通从研发、量产到运营、维护的全价值链 [2] - **资本共融**:在现有互投基础上进一步深化,围绕技术研发、供应链投资和全球市场拓展形成长期利益共享的战略绑定 [2] 合作意义与未来目标 - 此次合作旨在构建从技术研发到商业运营的完整闭环 [3] - 十亿级合作投入将撬动千亿级汽车智驾产业发展 [3] - 600台的量产规模助推小马智行超额完成2025年Robotaxi“千台规模”目标 [3] - 使小马智行2026年底实现3000台规模的目标更具底气 [3] - 成为中国智能网联汽车产业从单点突破走向系统生态竞争的关键一步 [3]