Workflow
自动驾驶
icon
搜索文档
驭势科技环境感知算法工程师招聘(可直推)
自动驾驶之心· 2025-12-06 11:04
公司招聘信息 - 公司正在招聘环境感知算法工程师,工作地点位于上海长宁,薪资面议 [3] - 该岗位的核心职责是开发无人驾驶的环境感知能力,包括利用机器视觉和激光雷达数据进行多传感器融合,实现目标跟踪、语义理解和道路拓扑构建等功能,以保障无人驾驶安全 [5] - 岗位要求候选人具备扎实的数学和机器学习基础,拥有基于视觉或激光雷达的目标检测、分割、识别、跟踪及BEV感知等算法的实战经验 [5] - 岗位要求候选人具备强大的工程能力,精通C/C++和Python,熟悉三维成像原理,并能开发高性能实时软件 [5] 行业技术趋势 - 环境感知能力被视为保证无人驾驶安全最关键和基础的能力 [5] - 行业技术前沿涉及多传感器数据融合、多目标跟踪、环境细粒度语义理解以及道路拓扑构建等复杂感知功能 [5] - 行业对算法工程师的技能要求广泛,需跟踪前沿技术,并涵盖从深度学习基础到具体应用算法(如场景分割、BEV感知)的实战经验 [5]
自动驾驶产业链投资全景:在技术突破与场景落地中寻找确定性机会
格隆汇· 2025-12-06 00:37
行业概览 - 自动驾驶产业已从技术研发阶段迈入商业化落地黄金期 [1] - 2025年中国智能驾驶市场规模已达2180亿元,L2+级辅助驾驶渗透率突破65% [1] - L4级自动驾驶在特定场景已形成运营闭环 [1] 上游核心软硬件 - 上游软硬件投资呈现产业资本主导战略绑定、财务资本追逐技术突破的特征 [2] - 华为哈勃科技以近11亿元战略投资德赛西威并持有3%股份,巩固了双方在智驾域控制器的合作 [2] - 德赛西威2025年智驾域控制器业务营收占比突破35%,二级市场估值较非绑定企业高出40% [2] - 百度风投参与禾赛科技多轮融资,使其2025年全球车载激光雷达市场市占率提升至28% [2] - 四维图新获得腾讯产业基金、阿里创投联合注资,其股价在2024-2025年因智驾地图需求爆发实现120%涨幅 [3] - 算法初创企业Momenta累计获得腾讯、上汽集团超50亿元投资,未盈利状态下估值突破200亿元 [3] 感知与决策层 - L3级技术落地推动传感器从单一视觉向多模态融合升级 [4] - L3级车型通常需要2-4颗高线数激光雷达,价值量是L2级系统的3-5倍 [4] - 百度Apollo与禾赛科技合作的定制激光雷达,通过规模化应用将成本降低近50% [4] - 欧菲光作为车载摄像头供应商,订单量同比增长超80% [4] - 2025年国内车载AI芯片市场国产化率突破40% [5] - 华为的智能驾驶合作格局已覆盖14家车企33款车型 [5] - 百度Apollo拥有2900件智能驾驶专利与500辆测试车队 [5] - 仿真测试市场规模年增速超60% [5] 中游系统集成 - 中游系统集成呈现双向绑定、生态共荣的特点 [6] - 中国一汽以超36亿元战略投资卓驭科技,成为其第二大股东 [7] - 卓驭科技2025年营收同比增长超300% [7] - 百度与吉利共同出资成立集度汽车,集度首款L3级车型订单量突破10万辆,上市前估值即达350亿元 [7] - 德赛西威因与头部企业深度合作,2025年动态PE维持在50倍以上,显著高于行业平均32倍水平 [7] - 科博达通过收购切入智驾域控赛道,2025年第三季度智驾业务收入达4.24亿元,同比激增2004% [7] - 绑定头部科技巨头的系统集成商更具投资确定性 [8] 下游应用场景 - 下游应用场景投资呈现梯度化布局特征 [9] - 全封闭场景中,国家能源集团战略投资北方股份研发电动无人矿卡,单台车年均节省成本超50万元,2025年订单量同比增长120% [9] - 港口场景中,招商局港口联合经纬恒润开发无人集卡,使青岛港单箱作业成本降低40% [9] - 2025年全封闭场景相关标的股息率平均达3.2% [9] - 半封闭场景中,福龙马2024年无人环卫车业务市场规模突破50亿元,同比增长120% [10] - 全域场景中,百度Apollo累计获得超200亿元融资,2025年深圳地区Robotaxi用户付费率提升至62% [10] - 百度智能驾驶业务估值在母公司体系中占比提升至25% [10] - Robotaxi单辆车日均订单超50单,用户付费率从2024年的35%提升至62% [11]
佑驾创新上市不满一年两度融资补血 业务增长乏力叠加H股股东即将解禁 或被剔除港股通
新浪财经· 2025-12-05 19:11
核心观点 - 自动驾驶公司佑驾创新在上市不满一年内,于2025年7月和11月连续启动两次再融资,以缓解持续的现金流压力和亏损扩大问题,但增发股份上市后迅速破发,反映出市场对其基本面及资金状况的担忧 [1][4][13] - 公司在多个核心业务赛道面临激烈竞争且处于落后地位,商业化进展缓慢,同时面临股东大规模股份解禁和可能被剔除港股通的双重流动性压力,未来发展挑战严峻 [6][7][8][15][16][17] 融资活动与资金状况 - 公司于2025年11月26日完成新一轮2.1亿港元配售融资,发行价14.88港元/股,较前收盘价16.53港元折让约9.98%,资金计划用于L4级无人物流车业务拓展及基础研发平台技术升级 [1][10] - 这是公司继2025年7月首次再融资(募资1.6亿港元,发行价23.26港元/股,折让14.8%)后的年内第二次融资,显示持续的“补血”需求 [1][4][10][13] - 公司于2024年末IPO募资约6.8亿港元,一度缓解资金紧张,使2024年末账面现金增至7.9亿元;但高研发与业务拓展导致现金持续消耗,截至2025年上半年末账面现金回落至5.7亿元 [2][3][11][12] 财务与经营表现 - 经营活动现金流长期为负:2022-2024年流出额分别为2.6亿元、2.8亿元及2.2亿元,截至2024年6月底账面现金仅余2.2亿元 [2][11] - 2025年上半年经营活动现金流流出1.6亿元,同比大幅增长88.4%;投资活动现金流流出1.4亿元 [3][12] - 2025年上半年实现营业收入3.5亿元,同比增长46.1%;但净亏损达1.5亿元,同比扩大40.2%,呈现增收不增利局面 [3][12] 股价表现与市场反应 - 公司股价在2025年3月初纳入港股通后曾创下39.5港元的盘中高点,但随后持续下跌 [2][4][11][13] - 2025年11月启动的增发,尽管给出近10%折让,但增发股份于12月2日上市当日即下跌10.2%,收于13.11港元/股,跌破发行价;截至12月5日股价收于11.78港元/股,较发行价14.88港元破发幅度达20.8% [4][13] - 在股价下行区间启动更大规模增发(本次募资2.1亿港元超上次,发行比例3.3%为前次两倍),被市场解读为现金流再度紧张的信号 [4][13] 行业竞争格局 - 自动驾驶软件领域:面临华为、蔚来、小鹏、理想等拥有自研团队和协同优势的车企竞争,第三方解决方案市场则有Momenta等已与主机厂建立稳定合作的对手 [7][16] - 无人车领域:小马智行、文远知行等已实现Robotaxi大规模商业化落地,而公司仅在苏州落地无人小巴业务,商业化进展明显滞后 [7][16] - 智能座舱领域:行业门槛较低,竞争激烈,已有德赛西威等技术成熟、市场份额稳固的头部企业 [7][16] 流动性风险 - 公司H股股东禁售期1年,预计将于2025年12月27日解禁,解禁股本规模达2.2亿股,占总股本的51%,若老股东集中抛售将加剧股价下行压力 [8][17] - 公司当前最新市值仅为49.6亿港元,2025年至今日均流通市值约77.8亿港元,已不满足港股通市值门槛(约100亿港元),预计将于2026年3月被正式剔除出港股通,可能引发股东在剔除前集中抛售 [8][17]
对话任少卿:2025 NeurIPS 时间检验奖背后,我的学术与产业观
雷峰网· 2025-12-05 18:24
文章核心观点 文章通过报道任少卿及其团队获得NeurIPS时间检验奖,回顾了其奠基性工作Faster R-CNN的深远影响,并深入探讨了任少卿加入蔚来后,在自动驾驶全栈自研、芯片定义、数据闭环体系构建以及技术路线(如世界模型)探索等方面的实践与思考,展现了蔚来在智能驾驶领域从零开始构建核心能力的过程与战略布局 [1][2][11][13][27] 根据相关目录分别进行总结 Faster R-CNN的成就与影响 - 任少卿、何恺明、孙剑与Ross Girshick共同发表的Faster R-CNN荣获2025年NeurIPS时间检验奖,该奖项表彰经过十年检验、对学科发展产生深远影响的奠基性工作 [1] - Faster R-CNN发表于2015年,将物体检测效率提升10倍以上,开创了端到端实时精准目标检测模式,其论文已被引用超9.8万次,是AI检测领域全球最高被引论文 [2] - 该模型的核心思想已深度融入人工智能基础技术,成为驱动自动驾驶、医疗影像、安防监控、工业检测、卫星遥感等关键领域的核心技术 [2] 研究理念与团队合作 - 孙剑坚持“simple but work”的研究理念,认为做核心工作需要远见、品位和坚持 [4][6] - 任少卿与何恺明的合作紧密且高效,日常节奏包括多次集中讨论与实验推进,何恺明几乎投入100%的精力,专注于研究问题、寻找方向与突破 [6][7][8] - 团队选择深度学习方向基于几个关键判断:方法有创新性、已有初步结果和进展、结果具备泛化能力而非技巧性(trick),验证了方向的可扩展性 [10] 加入蔚来与全栈自研启动 - 任少卿于2020年8月加入蔚来,首要任务是搭建团队并启动全栈自研L2产品,支持L3和L4,同时进行芯片选型 [13] - 蔚来第二代车是全球首个量产英伟达Orin芯片(使用4颗芯片)及高线束激光雷达的车型,于2022年3月在中国量产,半年后在欧洲量产 [14] - 团队在极短时间内(从拿到芯片到量产仅6-7个月)克服了Orin芯片作为新硬件在算力(比上一代增大8倍多)、架构、散热、功耗及工具链等方面的挑战,完成了复杂的自动驾驶域控制器(ADC)架构量产 [14][15] 自研芯片的定义与考量 - 作为需求方,团队参与了自研芯片的定义,基于对技术发展的判断,早在2021年就预见到Transformer将更广泛应用,这对芯片内存带宽提出了更高要求 [16] - 蔚来自研芯片具备行业最高的带宽,以支持Transformer等模型,并为支持更高级别自动驾驶(L3/L4)预埋了热备能力,可在百毫秒内实现芯片切换且用户无感 [17] 数据闭环与高效迭代体系 - 蔚来自2020年起重点建设数据能力,认为数据的价值在于针对特定模型筛选出的“corner case”,而非简单的数据拷贝,数据筛选过程消耗大量算力 [19][20] - 公司构建了灵活调度云端和车端算力的系统,并在此基础上建立了类似互联网行业的“AB test”系统,允许在量产车上并行测试下一代算法 [21] - 通过“AB test”系统,蔚来将主动安全功能的迭代效率大幅提升,即使面对高达200万公里一次误报(FP)的严格标准,也能实现三天迭代一次的速度 [22] - 针对超80万辆量产车的智驾接管数据,建立了自动化分析系统,能过滤掉99%以上的无效信息,仅返回0.1%-0.5%的有效数据供进一步分析,极大提升研发效率 [22] 对端到端与世界模型的技术思考 - Faster R-CNN本质是解决了物体检测任务的端到端问题,将检测速度提升至实时(10Hz、20Hz、30Hz),为视频处理和应用落地带来突破 [11] - 任少卿认为,端到端是自动驾驶技术演进的一个阶段,但并未解决所有问题,例如语言模型无法解决真实世界所需的时空认知问题 [24][25][26] - 世界模型旨在建立时空认知能力,学习物理规律和时空理解,以解决长时序决策问题,这是语言模型无法做到的 [26][27] - 蔚来于2023年决定All in世界模型,并于2024年7月首次公开发布,成为行业内率先拥抱此路线的公司之一,世界模型能支持长达10秒、1分钟甚至更长的时序推演,替代传统的规则代码(if else)处理长时序场景 [27][28][29][30]
知行科技宋阳:依托庞大工业基础和众多场景,中国能率先在AI领域取得更多突破
新浪财经· 2025-12-05 16:07
行业现状与规模对比 - 中国汽车年产量达3000万辆 而具身智能机器人去年产量仅为50万辆 仅为汽车产量的六十分之一 [3][6] - 自动驾驶汽车本质是轮式机器人 是机器人产业的一个分支 长期看其数量将非常庞大 [3][6] 行业融合与技术挑战 - 汽车与机器人行业在现阶段和长期的融合发展 是一个需要同时考虑长期与短期的问题 [3][6] - 大语言模型作为基座模型 在应用于自动驾驶或机器人时存在“中间跳跃”问题 即场景泛化能力不足 [3][6] - 以多模态VLA和机器人为例 在一个房间学习的动作难以泛化到其他场景 需要高成本采集数据 [3][6] - 为世界模型增加新维度(如重力)会导致模型所需算力和成本急剧上升 并伴随电力与散热等挑战 [3][6] 发展前景与路径 - 行业对发展前景持乐观态度 认为可依托中国庞大的工业基础和丰富的应用场景来推动人工智能发展 [3][6] - 通过利用实际产业场景和数据 以产业带动AI的发展模式 中国有望在人工智能领域率先取得更多突破 [3][6]
北京经开区举办2025年文明交通主题活动
新京报· 2025-12-05 13:52
活动概况 - 北京经济技术开发区于12月2日举办2025年“文明交通 礼行天下”主题活动 旨在共同践行亦庄新城文明交通理念 [1] - 活动通过倡议宣誓、表彰先进、智慧体验、互动游戏等多元形式开展 企业职工、社区群众、文明单位及志愿者等代表参与 [1] 具体举措与创新 - 经开区交通大队创新推出“闪光挂件”安全守护计划 该挂件集发光灯带与“注意行人”警示标志于一体 以“天工机器人”为设计灵感 [3] - “闪光挂件”计划已在北京建华实验亦庄学校试点应用 未来将逐步推广至全区 [3] - 活动现场设置四大特色展区 包括交通安全教育宣讲区、自动驾驶宣传区、文明交通互动区及拍照打卡区 [4] - 在自动驾驶宣传区 滴滴出行、文远知行、新石器等企业进行了无人驾驶知识科普 讲解技术安全原理与应用场景 [4] - 文明交通互动区设有“交通标志盲盒挑战”、“VR模拟过马路”等游戏 让参与者在趣味中掌握交通规则 [4] 参与规模与表彰 - 2025年 经开区共有34个单位403名志愿者参与了“我认领 我服务”文明交通志愿服务项目 [4] - 活动现场对“我认领我服务”文明交通志愿服务优秀组织单位和优秀志愿者进行了表彰 [4] 工作重点与长期规划 - 经开区将交通安全作为工作重心 多措并举从路面管理、工程治理到宣传教育全面发力 [6] - 交通安全宣传已陆续走进校园、社区、商圈、企业及亦企服务港 [6] - 2025年经开区举办了多场区级公共文明引导活动 涵盖文明过节、绿色低碳、文明养犬、文明观演、文明游园等主题 [7] - 公司表示将以此次活动为契机 推动社会各界形成“文明出行、安全出行、绿色出行”的共识 [7]
华宝基金:市场已经达到“低吸”的较好“击球点”
新浪财经· 2025-12-05 12:02
核心观点 - 科技板块经历一个半月调整后,底部板块的低点已基本明确,泛科技ETF产品配置价值显现,市场达到“低吸”的较好“击球点” [1][5] - 下一轮行情的核心方向尚不明确,主要机会预计在低位品种,高位品种存在补跌风险且主升浪已过 [1][3] - 短期反弹更多由流动性主导,产业逻辑有限,属于普遍反弹,尚未形成明确的行业级抱团方向 [3][12] 市场复盘与现状 - **海外市场**:受12月降息预期降温影响,自11月11日起,英伟达、特斯拉、铠侠等出现无差别破位下跌,谷歌走势也曲折 [2][11] - **A股市场**:在国际关系承压及海外流动性预期收紧背景下,呈现“顶部板块缩圈式抱团、底部板块超卖式下跌”的分化格局 [2][11] - 强基本面公司如中际旭创被深度抱团,而二梯队的香农芯创、工业富联已开始下跌,调整的时间和空间尚不充分但抱团强劲 [2][11] - 相对弱势板块如机器人、端侧芯片、恒生科技已进入连续超卖阶段,属于资金避险式卖出 [2][11] - 新题材如谷歌TPU、商业航空、半导体设备等依据边际信息交易 [2][11] - **股价相对位置**: - 高位板块:中际旭创基本没跌,新易盛、工业富联股价回归9月10日位置,死守上行通道箱体下沿 [3][13] - 低位板块:端侧芯片、国产机器人、金融科技等板块已回到5月初位置,模拟芯片等“狗不理”板块已达到4月份低点,深度调整空间基本到位 [3][13] 特定公司与技术前景分析 - **谷歌**:其大模型和芯片组合拳逻辑顺风,但仅靠大模型难以推动其接近4万亿美元市值的公司股价短期再显著上涨20-30% [4][13] - **谷歌TPU vs. 英伟达**:谷歌v6p芯片单位算力性价比弱于英伟达B200,其v7p和v8e与英伟达Rubin系列推出节奏相似(2026年),因此TPU颠覆英伟达的逻辑尚未充分暴露 [4][13] - **潜在影响**:若TPU颠覆英伟达,创业板人工智能ETF华宝可能下跌,相关博弈在2026年上半年将持续反复,目前尚无定论 [4][13] ETF配置策略与产品关注 - **配置逻辑**:美股开始底部显著反弹,主跌浪或已结束;A股高位板块死守箱体,低位板块调整充分,泛科技ETF配置有价值 [5][14] - **具体产品建议按顺序关注**: 1. 创业板人工智能ETF华宝(159363):以光模块为代表,相当于成长板块指数增强 [5][14] 2. 港股信息技术ETF(159131):已具有一定安全边际 [5][14] 3. 金融科技ETF(159851):作为指数情绪风向标 [5][14] 4. 港股通汽车50ETF(520780):处于情绪低点,叠加机器人转型概念 [5][14] 5. 科创人工智能ETF华宝(589520):科创板本轮跌幅较大,但预计短期起来较慢,可能需等待2月份以后 [5][14] 6. 港股通互联网ETF(513770):顺周期属性 [5][14] 7. 电子ETF(515260) [5][14]
11月港美股IPO上市月报|港股募资额显著增长,备案高效稳定市场信心
搜狐财经· 2025-12-05 11:48
港股IPO市场表现 - 2025年11月,香港交易所共有12家企业成功上市(含1家GEM转主板),首发募集资金约404.01亿港元,募资规模位居本年度第三 [1] - 当月募资主力为赛力斯(约142.83亿港元)、小马智行(约67.07亿港元)和创新国际(约54.95亿港元),三者合计贡献超过总募资额的65.56% [2] - 上市企业结构呈现鲜明的“硬科技”特征,行业覆盖汽车制造、自动驾驶、生物科技、软件服务等多个前沿领域 [1][4] - 上市企业地域分布多元化,覆盖粤港澳大湾区、京津冀、长三角及中西部等多个经济圈 [4] - 当月递表环节保持活跃,共有55家企业递交上市申请,为后续市场提供了持续且高质量的项目来源 [6][7] 美股IPO市场动态 - 2025年11月,受美国联邦政府停摆影响,未有中资企业在美股市场完成IPO上市 [1][8] - 停摆导致美国证券交易委员会暂停受理新的IPO申请,整体审核节奏明显放缓 [8] - 当月仍有7家中资企业首次公开递交美股上市申请,另有14家企业更新递表,行业多集中于物流、数字营销、旅游服务等现代服务领域 [1][9][10] - 递表企业中多家注册于香港,继续发挥其连接内地与国际资本市场的桥梁作用 [10] 境外上市备案情况 - 2025年11月,共有16家企业获得中国证监会境外上市备案通过,刷新2025年单月备案企业数记录 [1][12] - 所有获批项目的备案周期均控制在6个月以内,其中近半数项目在5个月左右获批,平均用时约5个月 [1][12] - 备案效率的持续提升和流程的标准化,显著降低了企业境外上市的前置不确定性与合规成本 [12]
新东方员工发文吐槽「加班成奴」,账号被秒封!公司回应;负债238亿拟花1.8亿炒股?乐视网:被误读;美光停止向消费者销售存储产品
雷峰网· 2025-12-05 08:44
存储行业战略转移 - 美光科技决定全面退出消费性存储器市场,停止生产PC级SSD和内存,旗下Crucial品牌将终止消费业务,专注于满足高性能AI芯片需求[4] - 美光将继续通过消费渠道销售Crucial产品直至2026财年第二季度末(2026年2月),并将为受影响的团队成员提供内部转岗机会[4][5] - 此决策正值AI浪潮引发全球内存短缺,数据中心领域需求激增,例如NVIDIA GB200芯片每个需要192GB内存,而消费电子规格较低、用量少,导致资源向更赚钱的数据中心市场倾斜[5] 乐视网财务状况与投资计划 - 乐视网拟利用不超过1.8亿元自有资金进行证券投资,其中二级市场股票投资不超过3000万元且银行股比例不低于50%,另有不低于1.5亿元用于北交所新股认购和国债逆回购[7] - 公司回应称1.5亿元用于打新和国债逆回购属于“无风险投资”,此前“负债238亿拟花1.8亿炒股”的说法被指误读[7] - 截至2024年末,乐视网负债总额为237.63亿元,资产仅18.55亿元,公司依靠运营和《甄嬛传》等版权收入维持,员工总数为159人[8] 新东方内部管理争议 - 新东方杭州一名员工发布内部信,控诉课程顾问团队陷入“996单休”循环,每日工作从早9:30至晚21:30以上,双休和八小时工作制难以实现[9] - 该员工发布信件后即被移出公司钉钉架构,文章被撤回,杭州新东方回应称其违反集团内部举报机制[10] - 此前俞敏洪曾在全员信中鼓励言论自由,该员工在信中引用了其观点[9] 佳能中山工厂裁员补偿 - 佳能中山打印机工厂停产,补偿方案包括“2.5N+1”经济补偿金及5个月税前工资的就业支援金,例如18年老员工总计可获约40万元[10][11] - 一位月薪5000元、工龄3年的员工预计可获得8.25万元补偿,是法定标准2万元的4倍多[12] - 工厂主动为员工对接本地企业举办招聘会,董事长亲自撰写推荐信,该厂员工人数从2010年约上万人缩减至2025年9月底的1400人左右[12] 亚马逊中国区与全球开店业务调整 - 亚马逊全球开店中国副总裁杨钧(职级L8)已离职,其部分团队被拆分合并,AGS团队规模剧烈收缩[16] - 自10月以来,亚马逊启动新一轮大规模裁员,部分卖家管理和招商团队裁员30%-70%,L5、L6中层管理者是重灾区,L7也有人员被调岗[16] - AGS高管团队稀少,大中华区仅有一个L10和四个L8,L7不到二十个,L6不到八十个,晋升通道拥挤[17] 长城汽车人事变动 - 长城汽车原副总裁刘向上已低调离职,其曾于2024年被派驻集团控股的智能驾驶公司毫末智行担任CEO[18] - 毫末智行于11月22日发布《停工放假通知》陷入困境,长城汽车未对此事给出回复[18] - 2023年至今,长城汽车至少有8位副总级别以上高管离职,涵盖魏牌、哈弗等核心品牌,魏牌总经理9年调整10次,欧拉7年更换7位总经理[19] 小米AI战略与人才引进 - 小米集团总裁卢伟冰回应“AI天才少女”罗福莉加盟,称小米在AI领域启动“压强式投入”,大模型进展远超预期,未来聚焦AI与物理世界的深度结合[21] - 小米AI投入增速连续保持环比50%以上,AI已成为全集团核心KPI,雷军亲自拍板为世界级人才提供舞台[21] - 罗福莉已担任Xiaomi MiMo大模型负责人,其加盟前,小米与北京大学的联合论文中她已作为通讯作者出现[22] 字节跳动豆包手机项目 - 罗永浩发文力挺豆包手机,称技术革命无法阻拦,AI助手未来将不可或缺[24] - 豆包手机助手工程样机被指存在“未经授权获取系统权限”等问题,官方回应称需用户主动授权,不存在黑客行为,且产品目前不面向普通消费者[24] - 豆包手机系统软件中发现锤子科技遗留字样及经典铃声,有消息称字节跳动高层认为锤子手机项目应持续做下去[25] 比亚迪电池业务管理升级 - 比亚迪从2024年第三季度开始对内部电池工厂推行“无瑕运营”改造计划,旨在追求产品0缺陷,提升制造、工艺及客户服务各环节效率[31] - 公司目标是在3-5个月内调整人员架构达到行业一流水平,2026年内达到外部大客户管理水平,最终对标日本丰田的管理标准[31] - 此举旨在支撑电池业务重新发力,以应对汽车业务增速放缓和产能利用需求,增强产品外部竞争力[31] 电商平台AI技术应用规范 - 北京市消费者协会联合京东、美团、抖音等8家电商平台签订全国首份《促进AI技术规范应用承诺书》,划定AI技术应用合规红线[32] - 承诺书要求商家和创作者在使用AI生成数字人主播或虚拟场景时,需在显著位置清晰标注“AI生成”或“拟真场景”[33] - 平台需对直播内容进行监测,对未标识的疑似AI内容添加提示标识,对违规行为采取屏蔽链接等措施[33] 寒武纪市场传闻澄清 - 针对网络传闻称寒武纪明年将交付50万片AI卡以抢占NVIDIA退出后的市场空缺,其中30万片为先进型号,公司发布公告予以否认,称相关信息为不实消息[34] 乐道汽车交付情况 - 乐道汽车旗下大型纯电SUV乐道L90上市4个月累计交付4万台,刷新细分市场最快交付速度纪录[38] - 第40000台车主为演员古天乐,其同时也是乐道L90黑骑士特别版的首位车主,该特别版车型限量999台,整车购买价30.68万元[38] 哈啰出行自动驾驶布局 - 哈啰出行首款L4级自动驾驶车型预计2025年6月量产,3月进行小批量交付,该车型基于启辰VX6打造[40] - 哈啰于2024年6月官宣进军Robotaxi赛道,并与蚂蚁集团、宁德时代共同出资超30亿元成立合资公司,9月获得阿里巴巴战略投资[40] - 公司计划到2027年部署超5万辆Robotaxi,目前已在湖南株洲和江苏溧阳实现商业化运营[40] 苹果公司高层人事变动 - 苹果公司在四天内先后有四位高管宣布离职,包括总法律顾问凯特・亚当斯、环境政策与社会事务副总裁丽莎・杰克逊、AI和机器学习高级副总裁约翰・詹安里亚以及用户界面设计副总裁阿兰・戴[43][44] - 新任总法律顾问詹妮弗・纽斯特德将于2026年3月1日接任,并兼任政府事务主管[43] 通用汽车自动驾驶战略调整 - 通用汽车重新聘用多位前Cruise高管,包括前Cruise和特斯拉高管罗娜莉・曼恩担任产品运营主管,以及前Cruise高管拉希德・哈克担任自动驾驶副总裁[44][45] - 通用汽车首席产品官斯特林・安德森自2024年5月加盟后对软件部门进行改组,旨在建立新的个人用自动驾驶汽车平台[45] 亚马逊云科技AI芯片进展 - 亚马逊云科技推出自研AI芯片Amazon Trainium,并宣布Trainium 2是目前全球最佳推理系统之一,部署速度比过去任何芯片快好几倍[46][47] - Trainium 3 UltraServers已正式可用,公司已全力研发Trainium 4,预计其FP4计算性能将比Trainium 3提升6倍,内存带宽提升4倍,高带宽内存容量提升2倍[47] OpenAI收购与战略动向 - OpenAI签署协议收购AI模型训练监控工具初创公司Neptune,计划将其工具深度整合到自身训练体系中,具体条款未公开[47][48] - OpenAI CEO萨姆・奥尔特曼曾研究收购或投资火箭公司Stoke Space以与SpaceX竞争,提议涉及数十亿美元投资并获得控股权,但目前谈判已不再积极推进[54][55] Anthropic的企业AI战略 - Anthropic CEO达里奥・阿莫代伊暗讽谷歌和OpenAI,称自家公司因专注于企业客户需求而竞争压力较小,从未发布过“红色警戒”[56][57] - 阿莫代伊对竞争对手在AI竞赛中投入巨额资金的做法持怀疑态度,认为当前困境源于AI经济价值增长的不确定性[58]
博世最新一篇长达41页的自动驾驶轨迹规划综述
自动驾驶之心· 2025-12-05 08:03
文章核心观点 - 博世发布了一篇关于基础模型在自动驾驶轨迹规划中应用的重量级综述,系统梳理了37种近期方法,提出了统一分类法,并批判性评估了其设计、优势与局限,旨在为该快速发展的领域建立结构化基础并指明未来方向 [2][11] 背景回顾 - 基础模型是利用海量数据学习表征并可适配多种下游任务的大规模模型,如大型语言模型和视觉语言模型 [4] - 研究表明,未经自动驾驶专门训练的现成基础模型已能令人惊讶地良好理解复杂驾驶场景,这使其成为构建自动驾驶专用方案的潜力基础,也是当前行业范式转变的关键驱动力 [5] - 轨迹规划是驾驶过程最核心的任务,其他能力均为其提供辅助,因此综述重点聚焦于基础模型如何助力轨迹规划模型 [8] 分层分类体系 - 利用基础模型的轨迹规划方法可分为两大主类别:为轨迹规划定制的基础模型、指导轨迹规划的基础模型 [16] - **为轨迹规划定制的基础模型**:通过微调现有预训练基础模型,直接用于自动驾驶场景,共22种方法,可进一步分为仅专注于轨迹规划的模型和具备额外能力的模型 [19][20] - **指导轨迹规划的基础模型**:不构建专用模型,而是将现成基础模型的知识转移到现有自动驾驶模型中,共15种方法,可根据知识转移发生在训练阶段或推理阶段进一步划分 [20][21][22] 为轨迹规划定制的基础模型 - **微调核心要素**:包括数据整理、模型设计和训练策略 [23] - **数据整理**:取决于模型用例,仅用于轨迹规划的数据集核心是“观测-轨迹”数据对;若需语言或动作交互能力,则需补充相应的问答对或指令-轨迹对数据 [24][28] - **模型设计**:主流思路包括直接使用现成视觉语言模型,或组合视觉编码器与大型语言模型并通过视觉适配器连接 [27][29] - **轨迹表征**:常见方式包括将轨迹作为文本生成、作为离散化的动作token、或作为数值集合通过附加的规划头单次生成 [31] - **模型训练**:通常通过单阶段或多阶段完成,例如先训练视觉适配器,再微调全部或部分参数 [29] - **仅专注于轨迹规划的模型**:根据是否使用思维链及使用方式,可细分为无思维链、文本输出作为思维链、初始轨迹预测作为思维链三类 [25][32] - **具备额外能力的模型**:除轨迹规划外,还具备语言交互和/或动作交互能力 [38] - **语言交互能力**:需要视觉问答数据对进行训练,评估采用自然语言处理领域的经典指标 [38][39][40] - **动作交互能力**:可根据用户指令规划轨迹,目前方法均在CARLA模拟器的合成数据集上训练,需具备规避误导性指令的机制 [43] 指导轨迹规划的基础模型 - **仅在训练阶段进行知识蒸馏的模型**:推理阶段无需调用基础模型,能保持效率,方法包括将CLIP表征对齐到端到端模型中,或利用GPT-4o输出元动作进行蒸馏等 [48][49][51] - **在推理阶段进行知识转移的模型**:训练和推理阶段都调用基础模型,计算成本更高,根据转移知识类型可分为转移场景描述、转移规划决策、或同时转移两者 [48][53] - **知识转移类型**:包括场景描述、元动作、轨迹等,通过不同编码方式融入到自动驾驶模型的各个层级 [53][54][55] 现有方法的数据集与代码开放性 - 开放性是推动研究进展和实际部署的关键,但无任何一种方法的所有资产均支持研究与商业双用途 [57][59] - 仅有5种方法公开了所有资产,但部分仍限制商业使用,其中4种属于“为轨迹规划定制的基础模型”,1种属于“指导模块化自动驾驶模型轨迹规划的基础模型” [59] - “指导端到端自动驾驶模型轨迹规划的基础模型”类别尚无开源实现,训练代码与模型权重是限制最严格的资产 [59] 开放问题与挑战 - **高推理成本导致部署困难**:基础模型参数庞大且自回归生成,导致推理延迟高,难以满足实际部署所需的10-30帧/秒帧率要求,例如Orion模型在A800 GPU上推理帧率仅为0.8帧/秒 [63] - **微调后的能力下降**:微调可能导致视觉语言模型丧失对轨迹规划潜在有用的能力,出现“概念遗忘”现象 [64][66] - **动作交互能力局限**:现有模型仅能处理短时域内可执行的指令,无法拆解和执行人类化的复杂多步指令 [68] - **仿真到现实的差距**:所有具备动作交互能力的模型均在合成场景中训练测试,存在域转移问题,阻碍实际部署 [69] - **性能影响因素不明**:不同方法在架构、数据、训练上差异巨大,难以厘清导致性能差异的核心因素 [70] - **缺乏推理能力评估基准**:需要建立标准基准来评估模型在复杂语言-视觉场景下的推理能力 [71]