Workflow
自动驾驶
icon
搜索文档
市场正在惩罚只懂理论的端到端算法工程师......
自动驾驶之心· 2025-12-29 09:07
行业人才供需现状 - 中游车企和Tier1供应商正积极投入人力和资源跟进端到端自动驾驶技术,表明行业需求旺盛[1] - 市场面临算法人才短缺,面试候选人往往只懂部分技术或停留在论文层面,缺乏量产经验和优化能力[1] - 端到端岗位薪资很高,但缺乏能力相匹配的算法人才,凸显了高端技术人才市场的供需失衡[1] 核心技术栈 - 导航信息、强化学习、扩散模型、自回归、时空联合规划是当下端到端自动驾驶落地最重要的技术栈[1] - 行业主流趋势是感知任务的合并与规控算法的学习化,如何高效合并感知任务和设计学习化规控模块成为各大公司核心技能[6] 课程核心内容与结构 - 课程为期三个月,包含七个实战项目,聚焦量产应用,从实战到落地层层展开[1] - 课程核心算法涵盖一段式端到端、两段式端到端、导航信息量产应用、开闭环强化学习、扩散模型+强化学习、自回归+强化学习、时空联合规划等[1] - 课程大纲共八章,系统性地从概述、两段式/一段式框架、导航应用、强化学习、轨迹优化、兜底方案到量产经验分享[4][6][7][8][9][10][11][12][13] 技术方案详解 - 两段式端到端框架涉及感知与规划控制的信息传递,其优缺点将被详细分析,并通过经典的PLUTO算法进行实战[7] - 一段式端到端框架可实现信息无损传递,性能上优于两段式方案,课程将学习基于VLA、Diffusion等多种方案,并深入VAD系列[8] - 导航信息在自动驾驶中起引导、选路、选道作用,课程将介绍主流导航地图格式、内容及其在端到端模型中的编码与嵌入方式[9] - 纯模仿学习存在局限,需结合强化学习以学习因果关系并实现泛化,课程将重点介绍强化学习算法及其训练策略[10] - 轨迹输出优化项目将实战基于模仿学习的算法,重点介绍扩散模型和自回归算法,并在监督微调后结合强化学习[11] - 量产兜底方案采用时空联合规划,通过轨迹平滑优化算法保证输出轨迹的稳定可靠,涵盖多模态轨迹打分搜索与平滑算法[12] 课程实施与要求 - 课程采用离线视频教学,配合VIP群答疑及三次线上答疑,答疑服务截止2026年11月30日[14] - 课程面向进阶学员,建议具备自动驾驶BEV感知、视觉Transformer、端到端算法、强化学习与扩散模型理论基础,以及Python、PyTorch和MMDet3D框架使用能力[16] - 学员需自备GPU,推荐算力在RTX 4090及以上[16] - 课程计划于11月30日开课,按周或双周解锁新章节,预计三个月结课[14][15][17]
AI Day直播 | 如何解决特斯拉提出的端到端三大挑战?
自动驾驶之心· 2025-12-29 09:07
特斯拉端到端自动驾驶架构的核心挑战 - 特斯拉在ICCV2025分享中提出了自动驾驶面临的三大核心挑战:维度灾难、可解释性和安全保证、闭环评测 [3][6] - 行业围绕这三大难题探讨了多种可能的解决方法 [3] 相关学术研究进展 - 研究提出了UniLION模型,旨在构建统一的自动驾驶模型,采用线性组RNN [3] - 研究提出了DrivePI模型,这是一个空间感知的4D MLLM,用于统一的自动驾驶理解、感知、预测和规划 [3] - 研究提出了GenieDrive模型,致力于构建具有4D占据引导视频生成能力的物理感知驾驶世界模型 [3] 技术分享与行业探讨内容 - 分享将详解特斯拉端到端技术路线的变迁以及FSD V14的具体内容 [6][13] - 分享将针对端到端架构的三大挑战,详细解析UniLION、DrivePI、GenieDrive等解决方案 [6][13] - 分享将探讨能够理解并与物理世界互动的通用人工智能的形态 [6][13] - 行业内部存在学术与量产的分歧,以及技术路线的持续较量 [14] - 行业正在深入探讨谁在定义自动驾驶下一代方案,例如VLA与WA的对比 [14] 行业活动与知识获取 - 通过直播和知识星球“自动驾驶之心”可获取更深入的自动驾驶技术内容,包括学习路线、技术细节、QA及未公开内容 [1][2][14] - 行业举办“硬核夜话”活动,与一线量产专家深入探讨自驾数据闭环工程 [15]
国际舆论看好中国经济发展前景:为全球发展注入稀缺的确定性
人民日报· 2025-12-29 08:14
宏观经济与增长预期 - 多家国际组织与投资机构上调2025年中国经济增速预期 国际社会普遍认为中国经济稳中向好、长期向好 具备基础稳、优势多、韧性强、潜能大的特点 [2] - 2025年前三季度中国货物贸易进出口总值同比增长4% 展现出强劲韧性 [2] - 预计2026年中国经济将在高科技、智能制造、绿色能源和服务消费等领域实现显著增长 [2] 产业政策与供应链 - 中国通过系统化顶层设计推动科技创新 提升关键领域技术水平 以维护自身产业链安全与韧性 并为全球产业链供应链稳定注入新动力 [3] - 中国出口韧性源于在先进产业领域形成的强大竞争优势 发展路径表明提高竞争力、推动创新和深化合作是可行之路 [3] - “十五五”规划建议将继续推动中国高水平开放 并通过扩大贸易、增加投资、加强南南合作等方式为发展中国家带来更多机遇 [3] 科技创新与新质生产力 - 2025年中国科技创新与产业创新加速融合 新质生产力蓬勃发展 中央经济工作会议将坚持创新驱动、培育壮大新动能列为重点任务 [4] - 中国在清洁能源技术运用方面掀起热潮 包括飞行汽车、送餐无人机等尝试正在创造经济价值 中国电动汽车产量远超其他国家 [4] - 中国正在自动驾驶和创新药等前沿技术领域加速推进 技术实力增长得益于加强产学研深度融合及国家顶层设计的创新体系与政策推动 [4] - 中国在制造业和技术创新领域处于领先地位 在清洁能源、电动汽车和人工智能等方面发挥引领作用 [4] - 中国在人工智能模型架构和算力效率等方面实现突破 以更低成本实现更高性能 为新兴市场国家提供可负担、可借鉴的技术路径 [5] 对外开放与区域合作 - 中央经济工作会议将坚持对外开放、推动多领域合作共赢确定为明年重点任务之一 [6] - 海南自贸港于12月18日启动全岛封关运作 被视为中国坚定不移扩大高水平对外开放、推动建设开放型世界经济的标志性举措 [6] - 海南自贸港是中国深化改革、扩大开放的新举措 具有重要战略地位 可面向全球南方特别是东盟深化合作 发挥桥梁作用 [6] - 在部分国家收紧市场准入的背景下 海南自贸港为中国持续推进贸易投资自由化便利化的重要体现 为全球投资者提供了更清晰稳定的政策预期 [6] - 海南自贸港凭借其政策优势、开放环境和产业布局 不仅为中国高质量发展注入新动能 也将为包括非洲国家在内的全球伙伴开辟广阔合作空间 [6]
一个月三家赴港 一家上市 智驾企业的增长与困局
北京商报· 2025-12-28 22:26
行业上市动态 - 2024年11月下旬至12月,主线科技、驭势科技、福瑞泰克三家智驾企业相继向港交所递表,加上12月上市的希迪智驾,一个月内四家智驾公司集中冲击港股市场,成为年度行业上市潮的缩影 [1] - 智驾企业在2016年前后兴起,经过约10年发展,产品、技术路线及营销模式基本定型,头部企业崭露头角,同时投资基金进入5-7年的资金回笼期,共同推动了资本市场的活跃 [2] - 已上市的希迪智驾作为细分赛道头部企业获得市场认可,其案例可能增强投资者对智驾赛道可行性的关注,为同行提供参考 [6] 营收增长表现 - 四家智驾企业均呈现营收高速增长的行业共性,但技术路径、应用场景与商业模式各有差异 [1] - 2022至2024年,希迪智驾营收从3105.6万元人民币增长至4.1亿元人民币,增幅最高;主线科技和驭势科技营收从不足1亿元人民币分别增长至2.54亿元和2.65亿元人民币 [1] - 福瑞泰克2022至2024年营收从3.28亿元人民币上涨至12.83亿元人民币,2025年上半年营收达9.28亿元人民币,同比增长197.5% [2] - 希迪智驾2025年上半年营收为4.08亿元人民币,已接近2024年全年水平;主线科技与驭势科技2025年上半年营收几乎持平,分别为9892.7万元和9864.7万元人民币 [3] 盈利与亏损状况 - 高营收增长并未带来盈利,2024年四家公司累计经调整净亏损超过8亿元人民币 [1] - 2025年上半年,亏损趋势出现分化:希迪智驾和主线科技经调整净亏损同比扩大,福瑞泰克和驭势科技同比收窄 [4][5] - 具体而言,2025年上半年福瑞泰克经调整净亏损最高,达1.52亿元人民币;希迪智驾为1.1亿元人民币,同比扩大86.7%;主线科技为5002.8万元人民币,同比扩大1.1%;驭势科技同比收窄26.8% [4][5] - 希迪智驾是四家企业中唯一在2025年上半年出现经调整净亏损增幅高于营收增幅的公司 [5] 研发投入变化 - 智驾企业曾因高研发投入被贴上“烧钱无底洞”标签,但研发开支占营收比重已显著下降并逐渐可控 [7] - 2022年,希迪智驾、福瑞泰克、主线科技、驭势科技的研发开支占营收比重分别高达355.8%、157.2%、131.1%和288.4% [7] - 到2025年上半年,各企业该比例均降至100%以下:福瑞泰克降至21.7%(同比减少38.3个百分点),驭势科技为98.9%(同比减少31.2个百分点),主线科技为60.9%(同比大幅减少464.8个百分点),希迪智驾为37.1%(虽同比增加23.4个百分点,但较峰值已大幅回落) [7] 商业模式与赛道分析 - 福瑞泰克作为高阶驾驶辅助解决方案供应商,与OEM合作,其业务核心在于前装解决方案,截至2025年6月30日,解决方案被51家OEM采用,累计量产项目超290个,规模性订单可快速摊薄边际成本 [8] - 福瑞泰克客户集中度高,2023年、2024年及2025年上半年,最大客户吉利集团贡献营收占比分别为43.3%、59.4%及76.0% [8] - 主线科技与驭势科技深耕港口、机场等封闭场景,环境可控、法规风险低、投资回报率清晰,商业模式易于验证和复制 [8] - 希迪智驾营收主要来自自动驾驶、V2X及智能感知三部分,其中封闭环境自动驾驶矿卡产品及解决方案是营收支柱,2022年和2025年上半年该业务营收占比分别为87.6%和92.1% [8] - 行业商业模式可简单划分为toC(如Robotaxi)和toB(如封闭场景物流)两类,有观点认为toB模式因场景固定、需求明确、能直接降本增效,可能更快实现盈利;而toC的Robotaxi面临复杂路况和法规限制,商业化周期更长 [9]
一个月三家赴港,一家上市,智驾企业的增长与困局
北京商报· 2025-12-28 20:48
行业上市动态 - 2025年11月下旬至12月,主线科技、驭势科技、福瑞泰克三家智驾企业向港交所递表,加上12月上市的希迪智驾,一个月内四家智驾公司集中冲击港交所 [1] - 智驾企业在2016年前后兴起,经过约10年发展,产品、技术路线及营销模式基本定型,头部企业崭露头角,同时投资基金进入5-7年的资金回笼期,共同推动了行业在资本市场的活跃度 [3] - 近期递表及上市的企业覆盖Robotaxi、Robotruck、OEM供应商及封闭场景解决方案等不同技术路径与应用场景,呈现出营收高速增长的行业共性 [1][3] 公司营收表现 - 福瑞泰克2022至2024年营收从3.28亿元上涨至12.83亿元,2025年上半年营收9.28亿元,同比增长197.5% [4] - 希迪智驾2022至2024年营收从3105.6万元飙升至4.1亿元,增长超12倍,2025年上半年营收4.08亿元已接近2024年全年 [4] - 主线科技与驭势科技2024年营收均突破2.5亿元,分别达到2.54亿元和2.65亿元,2025年上半年两家营收几乎持平,分别为9892.7万元和9864.7万元 [1][5] - 四家企业中,希迪智驾在2022至2024年间营收增幅最高 [1] 公司盈利状况 - 2024年四家公司累计经调整净亏损超8亿元,2025年上半年盈利趋势出现分化 [1][6] - 2025年上半年,福瑞泰克经调整净亏损最高,达1.52亿元,超过主线科技和驭势科技同期亏损总和 [6] - 希迪智驾2025年上半年经调整净亏损为1.1亿元,同比2024年上半年的5944.8万元扩大86.7% [6] - 主线科技2025年上半年经调整净亏损从2024年同期的4949.7万元扩大至5002.8万元,同比扩大1.1% [6] - 驭势科技和福瑞泰克在2025年上半年经调整净亏损同比收窄,其中驭势科技少亏26.8%,福瑞泰克少亏29.6% [6] - 希迪智驾是四家企业中唯一在2025年上半年经调整净亏损增幅高于营收增幅的公司 [7] 研发投入变化 - 2022年,各公司研发开支占营收比重极高:希迪智驾为355.8%,福瑞泰克为157.2%,主线科技为131.1%,驭势科技为288.4% [9] - 到2025年上半年,各企业研发开支占比均降至100%以下:福瑞泰克降至21.7%(同比减少38.3个百分点),驭势科技为98.9%(同比减少31.2个百分点),主线科技为60.9%(同比减少464.8个百分点),希迪智驾为37.1%(同比增加23.4个百分点,但较峰值大幅回落) [9] 商业模式与业务特点 - 福瑞泰克作为OEM供应商,其解决方案已被51家OEM采用,累计实现超290个项目量产,规模性订单可快速摊薄边际成本 [10] - 福瑞泰克存在客户集中风险,2023年、2024年及2025年上半年,最大客户吉利集团贡献营收占比分别为43.3%、59.4%及76.0% [10] - 主线科技与驭势科技深耕港口、机场等封闭场景,环境可控、法规风险低、ROI清晰,模式易于验证和复制 [10] - 希迪智驾营收主要来自自动驾驶、V2X及智能感知三部分,其中封闭环境自动驾驶矿卡产品及解决方案是营收支柱,2022年和2025年上半年该业务营收占比分别为87.6%和92.1% [10] - 行业商业模式可简单划分为toC(如Robotaxi)和toB(如封闭场景物流)两类 [11] - 有观点认为toB模式(如封闭场景)可能更快实现盈利,因其路线固定、环境可控、技术落地门槛较低,且能直接为企业客户降本增效 [12] - 另有观点认为toC模式比较容易实现短期盈利,而toB模式需要较长时间转化,但一旦跑通即可实现稳定收益 [12]
为什么前馈GS引起业内这么大的讨论?
自动驾驶之心· 2025-12-28 17:23
特斯拉自动驾驶技术方向 - 特斯拉在ICCV的分享指明了智能驾驶下一阶段发展方向为端到端+生成式3D高斯泼溅[2] - 特斯拉的实践基本可以判断是基于前馈式3D高斯泼溅算法实现的[2] 3D高斯泼溅技术演进路线 - 技术发展路线明确:从静态重建3DGS演进至动态重建4DGS,再到表面重建2DGS、场景重建混合GS,最终到前馈GS[3] - 前馈式3D高斯泼溅因能摆脱以往单场景优化的弊端,训练、推理、测试在一个统一架构内而受到国内重视[3][6] - 该技术可实现百毫秒级别的实时性,这是以往重建算法难以达到的水平[6] - 该技术可与世界模型结合,通过生成+重建打造更优的闭环仿真能力[6] 行业培训课程核心内容 - 课程旨在全面讲解3D高斯泼溅技术栈,从原理到实战细致展开[3] - 课程第一章涵盖计算机图形学基础,包括三维空间的隐式/显式表达、渲染管线、光线追踪、辐射场渲染,并介绍COLMAP、Gsplat等主流工具,附带基于3D Real Car训练模型的小作业[8] - 课程第二章深入3D高斯泼溅原理与算法,涵盖动态重建、表面重建、鱼眼重建和光线追踪的经典与最新算法,实战选用英伟达开源的3DGRUT框架[9] - 课程第三章聚焦自动驾驶仿真重建,解析Street Gaussian、OmniRe和Hierarchy UGP三篇核心工作,实战选用DriveStudio框架[10] - 课程第四章探讨3D高斯泼溅重要研究方向,包括COLMAP扩展、深度估计及Relighting,并分析其工业界应用与学术前景[11] - 课程第五章专讲前馈式3D高斯泼溅,梳理其发展历程与原理,并讲解AnySplat和WorldSplat两篇最新算法工作[12] - 课程第六章为线上答疑讨论,涉及3D高斯泼溅岗位需求、行业痛点及开放性问题[13] 课程安排与面向人群 - 课程开课时间为12月1日,预计两个半月结课,采用离线视频教学与VIP群答疑结合模式[15] - 课程章节按计划解锁:第一章于12月1日解锁,第二章于12月7日解锁,第三章于1月7日解锁,第四章于1月21日解锁,第五章于2月4日解锁[15] - 课程面向具备一定计算机图形学、视觉重建、NeRF、3D高斯泼溅基础知识,以及概率论、线性代数、Python和PyTorch基础的学习者[17] - 学习者需自备GPU,推荐算力在RTX 4090及以上[17] - 完成课程可掌握3D高斯泼溅完善的理论知识及相关技术栈、算法开发框架,并能与学术界及工业界同行持续交流[17]
深扒了学术界和工业界的「空间智能」,更多的还停留在表层......
自动驾驶之心· 2025-12-28 11:30
文章核心观点 - 2025年是自动驾驶从“感知驱动”向“空间智能”全面转型的分水岭[3] - 空间智能是对空间信息进行感知、表征、推理、决策与交互的综合能力,是将三维物理空间信息转化为可计算模型的核心基础[3] - 当前空间智能技术更多停留在感知和表征层面,在深层次的推理决策和交互能力上仍有待突破,因此存在大量发展机会[3] 世界模型在重构物理世界的“预演能力” - **GAIA-2 (Wayve)**: 一种面向自动驾驶的多视图生成式世界模型,通过潜在扩散技术,以自车动力学、道路语义及多智能体交互为控制条件,生成符合物理规律且时空一致的驾驶视频,为破解长尾效应提供数据闭环方案[5] - **GAIA-3 (Wayve)**: 模型规模较GAIA-2提升5倍,旨在通过捕获细粒度时空上下文来表征现实世界的物理因果结构[9] - **GAIA系列空间突破**: 通过潜在扩散模型和超高空间压缩比,实现了多相机视角下的时空一致性,构建了具备物理常识的“沙盒”,解决了空间扭曲问题[10] - **ReSim**: 通过将真实世界专家轨迹与模拟器生成的非专家/危险行为数据进行异构融合,利用扩散Transformer架构实现了对极端与罕见驾驶行为的高保真、强可控模拟[11] - **ReSim空间突破**: 解决了AI对极端空间状态的认知缺失,让AI学会“撞车瞬间的空间演变”,实现了对高风险物理交互的高保真模拟[12] 多模态推理实现从“语义描述”到“几何推理” - **SIG**: 提出“空间智能网格”结构化图谱方案,通过将场景布局、物体关系及物理先验显式编码为网格语义,替代传统纯文本提示,并建立SIGBench基准,旨在解决多模态大模型依赖语言捷径、缺乏真实几何推理能力的难题[16] - **OmniDrive**: 通过引入“反事实推理”生成大规模3D问答数据集,并配合Omni-L/Q代理模型,实现了视觉语言模型从2D认知向3D空间理解与规划的深度对齐[19] - **OmniDrive空间突破**: 引入“反事实推理”,弥补了语言逻辑与物理轨迹之间的鸿沟,让VLM能够真正理解三维环境下的风险评估[19] - **SimLingo**: 一款基于通用视觉语言模型且仅依赖摄像头的闭环自动驾驶系统,通过引入“动作梦境”任务解决了言行不一的难题,实现了驾驶行为与语义指令的高度对齐[21] - **SimLingo空间突破**: 提出“动作梦境”任务,AI必须预测出精确的物理执行信号,证明了通用大模型在理解复杂城市空间后的实时决策潜力[24] 三维物理实体的“实时数字孪生” - **DrivingRecon**: 一款通用型4D高斯重建大模型,通过直接从环视视频中预测4D高斯参数,并结合创新的PD-Block空间优化与动静解耦技术,实现了高效、高保真的自动驾驶场景动态重建与多任务仿真[26] - **DrivingRecon空间突破**: 实现了端到端4D高斯重建,通过“动静解耦”技术精准捕捉路面背景与动态障碍物的几何特征,提供了近乎实时的物理环境数字孪生[26] - **VR-Drive**: 通过引入“前馈3D高斯泼溅”作为辅助任务,实现了无需逐场景优化的在线新视角合成,显著增强了智驾系统在不同相机配置和视角偏差下的鲁棒性[29] - **VR-Drive空间突破**: 解决了硬件适配痛点,即使相机安装角度偏了5度,AI也能通过空间想象力补齐偏差,确保感知与规划在不同物理配置下的稳定性[29] 具身融合——打破“车”与“人”的空间隔阂 - **MiMo-Embodied (小米)**: 全球首个开源跨具身通用大模型,通过多阶段学习、思维链及强化学习微调,首次实现了自动驾驶与具身智能两大领域的深度融合[31] - **MiMo-Embodied空间突破**: 实验证明车辆对宏观交通流的空间感知可增强机器人导航,而机器人对微观物体交互的理解能反哺车辆决策,标志着自动驾驶被纳入“具身智能”版图[32] - **DriveGPT4-V2**: 一款基于多模态大语言模型的闭环端到端自动驾驶框架,通过多视角视觉标记器融合环视图像与车辆状态,并引入专家LLM进行在线模仿学习,实现了能够直接输出底层控制信号的高性能、可解释驾驶决策系统[36] - **DriveGPT4-V2空间突破**: 从“看图说话”进化到“闭环控制”,AI在环视视野中保持高局部空间细节,直接输出转向、加速等底层物理指令,实现了端到端空间智能的闭环落地[37] 工业界架构演进与共识 - **行业共识**: 2025年工业界在自动驾驶架构设计上达成高度共识,即从传统的模块化架构向端到端的VLA架构演进,旨在利用大语言模型的常识推理能力辅助驾驶决策[40] - **Waymo的EMMA与通用基础模型**: Waymo展示了其端到端多模态模型EMMA,该模型构建在Gemini等大规模预训练模型之上,直接将原始摄像头传感器数据映射为驾驶轨迹、感知对象和道路图元素,其核心理念是将所有非传感器输入和输出均表示为自然语言文本[41] - **Waymo的快速与慢速思考架构**: 提出“快速思考与慢速思考”架构,传感器融合编码器负责快速反应性动作,驾驶VLM负责处理复杂的语义推理,例如能通过语义分析命令车辆绕行路面起火等罕见场景[41] - **DeepRoute.ai与可解释的VLA**: 元戎启行推出的DeepRoute IO 2.0架构核心优势在于引入思维链推理,有效解决了端到端模型的“黑盒”问题[43] - **DeepRoute IO 2.0能力**: 系统不仅能执行驾驶动作,还能通过语言模型解释其决策路径,具备强大的空间意识和光学字符识别能力,能实时解读复杂路牌和临时交通指令[44] - **统一具身智能趋势**: MiMo-Embodied的出现标志着自动驾驶与具身机器人在空间智能层面的合流,该模型在12项自动驾驶基准测试及17项机器人基准测试中均创造了新记录[45] - **理想汽车的MindVLA**: 引入了空间智能概念,主要体现在3D Feature上,视觉和Lidar经由3D Encoder得到时序融合后的特征,再经由3D projector传递到下游的MindGPT中[45]
百度X-Driver:可闭环评测的VLA
自动驾驶之心· 2025-12-28 11:30
文章核心观点 - 哈工大与百度联合提出的X-Driver是一个专为闭环自动驾驶设计的统一多模态大语言模型框架,其核心创新在于利用思维链推理和自回归建模来增强感知与决策,旨在解决现有基于MLLM的自动驾驶方案在闭环评估中成功率低、存在幻觉和缺乏稳定轨迹输出的问题 [2][3] 方法架构 - 系统利用集成思维链推理机制的多模态大语言模型来执行场景理解、导航指令解释和交通规则理解 [6] - 输入为摄像头图像数据以及表示导航命令和提示的文本,输出为思维链推理过程和最终的驾驶决策 [6] - 系统以闭环方式运行,执行的动作影响环境并生成新的感知数据以进行持续优化 [7] 核心模型与技术细节 - 模型基于LLaVA架构,使用CLIP的ViT-L/14图像编码器提取图像特征,并通过映射网络将其对齐到文本嵌入空间,再输入微调后的LLaMa网络 [9] - 采用连续图像编码方法,避免使用VQ-VAE等离散编码方法导致的关键信息丢失,例如能更有效地保留远处红绿灯的信息 [13][14] - 通过监督微调整合高质量的思维链提示数据,将驾驶任务分解为对象检测、红绿灯状态、交通标志和车道信息等子任务,鼓励模型进行结构化逻辑思维 [11][12][17] 训练与推理过程 - 监督微调训练涵盖对复杂3D驾驶环境的精确感知,包括动态物体的位置、速度、轨迹预测,以及实时障碍物识别和空间定位 [15] - 训练还包括对导航指令的深入理解和对交通法规的遵守,如识别各类交通信号灯状态、解读监管/警告/信息标志,以及准确的车道检测与决策 [15] - 推理时,模型对单帧图像和当前车速进行多模态融合分析,在思维链提示指导下,逐步推理对象位置、类别、关注必要性,并据此更新最终驾驶决策 [18][20][23] 闭环仿真实验与性能评估 - 在CARLA仿真环境中使用Bench2Drive数据集进行闭环测试,该数据集包含超过200万帧仿真数据,用于评估城市、高速公路及恶劣天气等不同条件下的性能 [8][27] - 评估关键指标为驾驶评分和成功率,驾驶评分综合考虑路线遵守、速度控制和交通规则合规性,成功率衡量无碰撞或重大违规完成任务的百分比 [28] - 定量结果显示,在Bench2Drive数据集上,使用500K和2.2M样本与UniAD对比,整合思维链推理的X-Driver版本在驾驶评分和成功率上均有提升 [29] - 具体数据表明,在bench2drive220任务中,UniAD的成功率为17.5%,而X-Driver无思维链版本为15.2%,整合思维链的版本提升至18.1% [30] - 在bench2drive50任务中,UniAD成功率为22.0%,X-Driver无思维链版本为19.8%,整合思维链的版本提升至24.0% [30] 现状总结与行业洞察 - 当前在闭环仿真器上的自动驾驶成功率仍处于较低水平,约为20%左右 [30][31] - 使用仿真数据测试与现实世界存在差距,不能完全反映实际性能 [31] - 目前行业倾向将多模态大语言模型结合思维链推理生成的驾驶决策,作为慢系统中规划轨迹的初始解,用以加速下游的规划搜索过程,而非直接用于控车 [31]
国家基金助力,A股行情看多
搜狐财经· 2025-12-27 20:54
国家创业投资引导基金启动 - 基金正式启动,是推动“十五五”规划落地的重要金融举措 [1] - 基金投资策略为“投早、投小、投长期”,对种子期、初创期企业的投资规模不低于总规模的70% [1] - 被投企业估值需在5亿元人民币以下,单笔投资不超过5000万元人民币,基金存续期为20年 [1] - 投资方向聚焦于战略性新兴产业和未来产业 [1] A股市场行情 - 今日上证指数收阳,实现8连阳 [1] - 市场成交额放量至2.18万亿元人民币 [1] - 市场呈现“人类主航道和上游资源双轮驱动”格局,上游资源期货价格批量创新高 [1] 政策与监管动态 - 上海证券交易所明确商业火箭企业适用科创板第五套上市标准 [1] - 中国首批L3级自动驾驶汽车开启规模化上路运行 [1] - 交易所公布2026年降费措施 [1] - 中国人民银行着力健全“长钱长投”制度环境 [1] 行业与板块关注 - 本周市场关注点包括微盘基金 [1] - 新闻涉及的关键板块包括人工智能、量子科技、氢能储能等战略性新兴产业和未来产业、商业航天、自动驾驶 [3]
2026年的特斯拉:电动车承压,AI接棒
华尔街见闻· 2025-12-27 18:53
核心观点 - 公司正押注人工智能和自动驾驶技术重新定义未来,市场对其在自动驾驶出租车、人形机器人和自研芯片领域的进展寄予厚望,推动其股价表现超越大盘 [1][2][4] - 尽管电动车核心业务面临销售压力,但分析师认为长期价值将由机器人、芯片及自动驾驶等新业务定义,部分分析师给出非常乐观的估值预测 [4][16] 股价表现与市场预期 - 公司股价今年累计涨幅超25%,超越标普500指数18%的涨幅,并在12月触及498.83美元的盘中历史高位 [2] - Wedbush分析师预测,公司可能在“怪兽级的一年”后达到3万亿美元估值,接近当前市值的两倍 [4] - 投资者已习惯公司CEO的过度承诺,只要能看到可见进展就不会过度担忧 [6] 自动驾驶出租车(Robotaxi)进展 - 服务目前仅在奥斯汀和旧金山湾区运营,活跃车辆约160辆,远低于承诺的在至少八个都市区部署的目标 [4][7] - 公司正在奥斯汀测试无监督行程,并希望在12月底前移除车内安全监督员 [9] - 分析师对2026年扩张预期存在分歧:德意志银行预测,如果达到年初1500辆的目标,到6月车队规模可能超过2500辆;而摩根士丹利等机构采用更保守的预测 [11][12] - 延迟的部分原因是公司高度重视安全,危险事件可能迫使其暂停测试 [12] - 专用的Cybercab robotaxi车型将于2026年投产,但何时能在美国道路上运营尚不清楚 [12] 完全自动驾驶(FSD)软件与海外扩张 - 截至第三季度,仅12%的公司客户付费启用FSD [12] - 海外市场扩张被视为关键变量,可能带来额外收入、训练数据并可能提振销售 [12] - 公司计划在1月向阿联酋提供FSD,这将是其在中东的首个市场 [12] - 预计海外相关监管机构将在“2月或3月左右”全面批准FSD [12] - 荷兰监管机构计划2月测试该系统,可能为在荷兰获批铺平道路,进而可能获得欧盟其他国家的认可,有助于改善在欧盟的销售 [13] 电动车销售现状 - 美国市场电动车销量预计2025年下滑9%,主要因为取消了此前激励购买电动车的税收抵免 [5][14] - 中国市场销量同比下降9% [5] - 欧盟市场今年前11个月销量同比下降约39%,公司面临竞争对手日益激烈的竞争 [5][13] - 有分析师认为,市场环境变化最终可能对拥有强大产品、成本纪律和忠诚度的公司有利 [15] 人形机器人(Optimus)发展 - 摩根士丹利估计,到2050年人形机器人市场价值可能达到5万亿美元,该技术将在2030年代中期加速发展 [18] - 公司CEO提议以约3万美元的价格出售Optimus机器人,并表示该产品有朝一日可能占公司价值的80% [19] - 公司在设计机器人的手和前臂以及采购零部件方面遇到问题,因为缺乏现成的供应链 [20] - 用于批量生产的第三版Optimus原型预计将在3月前准备好进行演示 [21] - 有分析师认为,这仍是一个“次要”产品,不太可能在近期开始为公司的收益做出贡献 [22] 自研芯片(AI5)与未来路线图 - AI5是公司计划在2026年底开始生产的下一代芯片,将为机器人、数据中心和robotaxi提供动力 [22] - 公司CEO声称AI5较当前的AI4有重大改进,在每瓦性能上可能高出两到三倍,在每美元AI性能上可能高出10倍,并优于英伟达的竞争芯片 [22][23] - 公司2026年的路线图还包括生产新能源产品、更新下一代跑车计划,以及全电动Tesla Semi卡车在经历多年延迟后于2026年下半年进入批量生产 [24]