Workflow
数据闭环
icon
搜索文档
智驾的2025:辞旧迎新的一年
自动驾驶之心· 2026-01-04 09:04
2025年自动驾驶行业核心发展脉络 - 2025年是自动驾驶行业承上启下、辞旧迎新的一年,主要围绕“向下普及”和“向上挑战”两条主线展开 [4] - 传统车企如比亚迪、吉利、奇瑞扮演向下普及角色,将高速NOA功能下放到10万+车型,并计划在2026年将城市NOA功能下放到10万+车型 [4] - 新势力及头部智驾供应商负责向上挑战技术上限,秉持一年一代新技术的做法,在端到端之后继续探索新技术 [4] 技术范式演进:从端到端到世界模型 - 端到端技术解决了标准道路场景“好开”的问题,但对罕见高风险Corner Case解决能力有限 [5] - 世界模型是智驾技术从“被动反应”走向“主动思考”的关键分水岭,意味着第三次技术范式演进:从1.0规则式、2.0端到端到3.0生成式智驾 [5] - 2025年,前沿技术辞旧迎新,端到端大规模普及,同时世界模型、VLA实现了从0到1的量产上车 [5] - 小鹏、小米等公司从研究VLA转向世界模型研究,世界模型的热度也延伸至具身智能领域 [5] 世界模型的竞争格局与量产进程 - 世界模型的发展遵循从0到1、再从1到10的量产规律 [6] - 2025年,蔚来在国内首发世界模型量产上车,完成了从0到1最艰难的阶段 [6] - 进入2026年,世界模型将迎来从1到10的性能爆发增长阶段,国内目前蔚来走在从1到10阶段,更多玩家仍在从0到1阶段 [6] - 早期布局世界模型的代表公司包括蔚来、特斯拉、华为,其中蔚来在2024年业内聚焦端到端时已发布世界模型,宣布从“感知驱动”转入“认知驱动” [5] 数据闭环成为研发核心 - 2025年智驾开启“炼丹模式”,数据闭环第一次成为核心中的核心 [6] - 过去几年许多公司的“数据飞轮”更多是营销作用,对云端算力、数据及人才投入不足 [6] - 2025年许多玩家在数据基建上疯狂“补课”,数据闭环及强化学习人才抢手,云端算力成本成为研发投入大头 [6] - 有前瞻性布局的玩家如蔚来已享受到数据基建红利,其较早投入云端数据闭环,并在车端4颗芯片中专设一颗用于数据收集、标注和训练,为其首发世界模型奠定基础 [7] 软硬一体化趋势与自研芯片 - 2025年是软硬一体的大年,蔚来和小鹏实现自研芯片上车,头部智驾供应商地平线、Momenta也走向软硬一体 [7] - 自研芯片不仅为降低成本,更因智驾进入模型时代,软硬深度协同重要性提高,需针对自身算法架构量体裁衣以最大化算力利用率 [7] - 自研芯片可把控芯片量产节奏,避免因供应商交付延迟影响算法上车及新车上市 [7] - 自研芯片存在“外包式自研”与“真自研”之分,蔚来投入大几百人技术团队进行真自研,设计芯片架构,实现深度软硬协同 [8] - 蔚来推出的“神玑NX9031”智驾芯片、“SkyOS·天枢”全域操作系统及“天行智能全主动底盘”为行业提供了明确技术方向 [8] L3牌照发放与行业下半场竞争 - 2025年临近年底L3牌照发放,标志着自动驾驶从上半场(L2+量产)转向下半场(L3、L4)竞争 [8] - 虽然首批L3牌照被部分传统车企申请到,但其L2+能力不足且使用供应商方案,形式大于本质 [9] - 未来真正具备拿到下半场门票的是新势力、华为等挑战前沿技术上限的玩家 [9] - 下半场门票的核心是模型能力,尤其是具备世界模型能力的玩家,如已实现世界模型量产上车的蔚来 [9] 技术价值与未来公司形态 - 智驾技术的终极价值在于解放驾驶者精力和减少交通事故,当前阶段将“减少事故”置于首位 [9] - 智驾进入世界模型阶段,将与全球最前沿的生成式AI技术并驾齐驱 [9] - 在世界模型竞赛中领先的企业,如蔚来,未来将不仅是一家汽车公司,而是一家基于世界模型的AI+硬件+能源生态公司 [10] - 智驾的加速普及由端到端、VLA、世界模型等AI技术突破驱动,也得益于华为、地平线等核心供应商技术的成熟 [9]
搞自驾这七年,绝大多数的「数据闭环」都是伪闭环
自动驾驶之心· 2025-12-29 17:17
文章核心观点 - 截至2025年底,自动驾驶行业所宣称的“数据闭环”大多仍停留在各算法团队内部的“小闭环”,距离理想中“数据直接解决问题”的“大闭环”仍有数层台阶之遥 [1] 数据闭环的理想标准 - 真正的数据闭环至少需满足三层标准:问题发现自动化、解决效果可量化可复盘、投入产出可评估 [4][5] - 问题发现应实现从线上问题自动归类、构建数据集、进入训练/仿真、产出候选方案到自动评估效果的全流程自动化,人的角色主要是定义目标和拍板 [4] - 系统需能持续追踪新版本上线后,特定问题的发生频率是否下降,以及是否引入了新的负面问题 [7] - 需要设计并落地一套从车端实时触发到云端历史数据挖掘、仿真评价的代码级统一的触发器(Trigger)体系 [5] - 目标是将每一次急刹车、接管或奇怪行为都结构化、可计算,减少主观判断 [5] 行业现状与主要断点 - 目前多数厂商的“数据闭环”实质是“数据驱动的研发流程加一些自动化工具”,且局限在单个算法团队的小视角 [8] - 一个典型流程包括:各模块定义Trigger捞取数据、清洗标注、训练回归、上线监控,但这更多是模块级、算法视角的小闭环,而非系统级闭环 [9][13] - 主要断点之一:问题发现多为“被动闭环”,依赖司机反馈、运营投诉或人工刷录像,而非系统从海量数据中自动发现异常,是“问题驱动数据”而非“数据自动发现问题” [10][14] - 主要断点之二:问题归因困难,同一现象(如急刹)背后常是感知、预测、规划、控制等多模块高度耦合的原因,缺乏体系化诊断工具,导致责任划分不清 [12][15] - 主要断点之三:数据到方案的链路常止步于“数据到模型”,即只关注离线技术指标提升,缺乏对解决了哪个真实线上问题以及业务价值的追踪 [16] - 主要断点之四:“自愈”程度有限,从问题收集、标注、训练、评估到上线的全流程中,人工干预仍占大头,系统更像高度自动化的生产线而非能自我决策的“自愈系统” [17][21] - 主要断点之五:组织结构(如各算法团队、Tier1、整车厂各有各的OKR和边界)本身成为闭环的断点,导致系统层面难以协同 [18][22] 作者实践的数据闭环体系 - 体系设计理念激进,将“数据当产品、指标当第一公民”来设计 [24] - 整体思路:从“体感指标”出发,用Trigger将世界离散成token,再用LLM进行分类和路由,最后用统一代码串联发现与验证 [25] - **从体感指标出发**:将用户有感的体感指标(如急刹、接管次数)作为“第一公民”,要求100%记录,并放弃“拷盘式”上传,采用类似互联网埋点的事件上报方式 [26][27][29] - **车端Trigger机制**:在算力受限(仅一颗Orin X)条件下,采用高召回、极低开销的micro log/mini log机制,车端先以轻量Trigger打包疑似事件数据(micro log),云端二次确认后,再触发上传更详细数据(mini log) [30][32][33][34][35] - **定制化数据拉取**:问题经人工初分或LLM分类后,会根据责任团队(如规控、感知、硬件)定制化下发任务,拉取所需细粒度数据(如规划轨迹、原始传感器数据、CAN报文),而非简单记KPI [36][40] - **代码级统一**:实现了车端数据挖掘、云端历史数据挖掘、仿真验证评价的Trigger逻辑代码级统一,确保从问题定义到验证评估的语义一致,避免实现偏差 [41][44] - **问题自动分发**:构建了领域专用tokenizer(Trigger)加classifier(LLM)的两阶段架构,Trigger将原始多模态时序信号编码成离散token序列,再文本化后交由LLM进行时序分类和路由 [43][45][47][48] - **弱监督在线学习**:利用研发人员在问题管理系统中的真实“改派行为”作为弱监督标签,持续优化LLM分类器,形成在线学习闭环 [49][53] - **Trigger框架统一与易用性**:所有Trigger逻辑用纯Python实现且跨平台可跑,通过提供结构化文档和示例,并利用LLM辅助生成代码,降低编写门槛,让测试、运营等非算法同学也能参与 [50][54][55] - **量产环境解耦**:将数据挖掘Trigger与线上主算法版本解耦,挖掘逻辑可作为“配置”或脚本通过云端下发,在车端沙箱中执行,从而灵活应对突发场景(如大雪天)而不必等待整车版本更新 [56][57][59] - **动态控制挖掘行为**:云端对挖掘任务进行动态启停控制,当数据量足够覆盖必要场景分布后,自动关闭或降采样,避免数据重复和资源浪费 [59] 数据标签与检索策略 - 严格区分“世界标签”(客观物理世界/场景属性,如天气、道路类型)和“算法标签”(算法中间结果/表现,如检测框抖动),前者用于精细筛选和分布分析,后者用于归因与调参 [60][61] - 向量检索不适合作为海量存量数据的粗筛主力,因其召回成本高、语义易受训练分布影响且长尾场景易被淹没,更合理的做法是先利用结构化标签规则过滤掉80%-90%无效数据,再在缩小的子集上用向量检索进行语义级精筛 [62][63][64] 生成式与仿真数据的定位 - 生成式/仿真数据主要用于补充现实中难以凑齐的长尾场景训练(如路上的锥桶、路面坑洼),以扩大模型“见世面”并提升召回,但不能替代真实评测 [65][66][67][68] - 最终用于评测和放行的评测集坚持只使用真实数据,因为无法证明仿真完全模拟了真实世界 [69] - 警惕生成式数据提升召回时可能引入误检(FP)副作用,由于评测集难以完全覆盖FP,可能导致线上模型“到处乱看东西” [70][71][72][73] - 采用版本间逐帧全量差异分析来监控副作用:对两个版本在同一批真实数据上的感知结果进行全量比对,先不争论真值对错,而是分析差异模式(如哪些距离段、类别下差异激增),结合人工抽查判断是召回提升还是误检泛滥,确保“涨得干净” [74][75][76][78][79] 未来展望与挑战 - 当前体系更接近“Bug-Driven开发体系”,推动迭代的核心是具体bug的发现、量化和跟踪 [77][80] - 当前主要卡口已从“发现问题”侧转向“解决问题”侧,受限于研发人力带宽、标注成本以及仿真验证能否代表真实世界等挑战 [81][82][83] - 两个乐观方向:端到端/模仿学习架构兴起,其更直接对齐人类驾驶行为,绕开部分中间真值标注难题;闭环仿真/世界模型快速发展,旨在让仿真环境更接近真实世界,以支撑大规模自动化验证 [84][87] - 未来需降低解决一个bug的边际成本,并让端到端等方法在验证和安全上更可控,结合现有工程实践积累,才能使“数据驱动”从口号变为可持续运行、能算账、可规模化复制的基础设施 [85][88]
汽车帮热评:工信部发放L3准入资格意味着什么
21世纪经济报道· 2025-12-17 22:52
行业竞争逻辑的根本性变化 - 工信部首次发放L3级“有条件自动驾驶”车型准入许可 长安深蓝SL03与极狐阿尔法S6率先入围 限定在北京、重庆的高速/快速路开启试点 最高时速50-80km/h 仍要求驾驶员随时接管 [1] - 特斯拉宣布其“无人驾驶”Robotaxi取消安全员 计划2026年直接以L4形态上路运营 [1] - 两件事叠加意味着中国市场的竞争逻辑即将发生三点根本性变化 [1] 竞争焦点从硬件转向法规与运营 - 国内传统车企拿到L3“准生证” 但只能在固定路段、低速场景下卖车 [1] - 特斯拉跳过L3 用L4 Robotaxi直接切入出行运营 把车变成“会赚钱的资产” [1] - 后续车企必须同时拿到“政府准入”与“运营牌照”两张通行证 否则硬件再先进也只能停留在辅助驾驶层面 无法打开持续收费的出行服务市场 [1] 技术路线升级为数据闭环速度之争 - L3车型虽然可以合法销售 但责任主体仍是车主 车企拿到的是“有限数据” [2] - 特斯拉Robotaxi一旦大规模跑起来 所有传感器数据归自己 每日可生成上亿公里真实城市场景数据 用于快速迭代端到端大模型 [2] - 国内车企若想不被甩开 只能两条路:一是自建出行平台 把卖出去的车反向接入运营 二是与滴滴、T3、高德等合作 用第三方流量换数据 [2] - 没有数据闭环的L3车型 很快会变成“一次性硬件” [2] 行业淘汰赛升级为资质与资金双重筛选 - 政策端已明确:L3准入只给“完成安全评估+具备冗余+能远程监管”的企业 相当于把90%以上缺乏自研电控、芯片、云控平台的小厂挡在门外 [3] - 运营端更残酷:Robotaxi需要持续烧钱做地图、客服、保险、运维 单车年度亏损普遍20万-30万元 只有背靠大集团或上市公司的品牌才能撑到盈利拐点 [3] - 结果是“有资质+有现金”的头部集团(长安、北汽、比亚迪、吉利、广汽、上汽)与“有资本+有AI”的科技巨头(华为、百度、滴滴、小马智行)结成联盟 二线品牌要么被并购 要么退守低阶辅助驾驶市场 [3] - L3准入是“门票” Robotaxi是“终局” 谁能先把L3卖出去的车变成24小时跑数据的Robotaxi 谁就拿到下一轮的生存权 [3]
理想下一步的重点:从数据闭环到训练闭环
自动驾驶之心· 2025-12-14 10:03
理想汽车智能驾驶技术发展路线 - 公司智能驾驶发展经历了四个阶段:规则时代的轻图和无图方案、基于AI的端到端(E2E)与视觉语言模型(VLM)快慢双系统、以及最新的VLA司机大模型 [6] - 在技术演进过程中,导航(Nav)模块是重点突出的部分 [6] 数据闭环的现状与能力 - 公司已建立完整的数据闭环流程:影子模式验证→数据触发回传→云端数据挖掘→自动标注→生成训练集训练模型→模型下发验证性能 [9] - 数据回传过程已能做到一分钟内完成 [10] - 公司目前积累了15亿公里的驾驶数据,并使用200多个触发器(Trigger)来生产15-45秒的片段(Clip)数据 [11] - 端到端量产版本的MPI(平均无干预行驶里程)已达到220公里以上,相比2024年7月底的版本提升了约19倍 [13] 数据闭环的局限与行业新阶段 - 仅靠数据闭环无法解决所有问题,尤其是长尾场景的收敛问题,例如交通管制、烟花燃放、突然变道等 [16] - 行业观点认为,自动驾驶已进入“下半场”,需要从“数据闭环”演进到“训练闭环” [18][21] 训练闭环的核心架构与关键技术 - L4级别训练循环的核心是VLA司机大模型、强化学习(RL)和世界模型(WM)的结合 [23] - 轨迹优化由VLA的扩散模型和基于世界模型的强化学习共同完成 [23] - 强化学习不仅包括RLHF,还扩展至RLVR和RLAIF [23] - 世界模型主要用于场景重建和新视角复原 [23] - 闭环自动驾驶训练的关键技术栈包括:区域级别的仿真、合成数据和强化学习 [24] 仿真与场景重建技术 - 仿真依赖于场景重建技术,包括:视觉/激光雷达重建、区域重建、多趟重建、场景编辑和风格迁移 [26] - 公司在重建方面已有两年工作积累,并发表了两篇顶会论文 [28] - 近期技术方案从重建发展到生成,例如Feedforward 3D高斯泼溅(3DGS)技术,无需点云初始化,可直接从视觉输入得到结果 [29] - 在联合重建与生成方面也有一篇顶会论文 [32] 合成数据生成与应用 - 合成数据依赖于多模态生成技术,包括:视频/点云生成和神经渲染 [26] - 公司在生成方面的工作已产出三篇顶会论文 [34] - 生成技术的应用涵盖场景编辑、场景迁移和场景生成 [36] - 公司在新的训练数据配比上做了大量工作 [38] 训练闭环的挑战与系统能力 - 可交互的智能体(Agent)是构建训练闭环的关键挑战 [40] - 系统能力是增强引擎的关键,包括:世界模型提供仿真环境、3D资产构建多样化场景、仿真智能体(SimAgents)进行交互式行为建模、奖励模型提供准确的反馈泛化能力、以及GPU工程加速推理 [41] 成果总结 - 公司在相关领域已取得成果并获得奖励 [45]
“智驾普及元年”年终大考:奇瑞猎鹰智驾的承诺兑现了吗?
钛媒体APP· 2025-11-28 22:16
行业核心观点 - 2025年中国智能驾驶行业从“参数竞赛”迈入“落地验证”阶段,消费者关注点从“有没有”转向“好不好用”和“靠不靠谱” [3] - 行业面临“理想与现实”的鸿沟,存在功能交付“减配”、非结构化道路失误率高(是结构化道路的3-5倍)等核心痛点 [4][5] - 行业竞争正从“参数比拼”转向“场景落地能力比拼”,车企的“承诺兑现能力”成为新的核心竞争力 [20] 奇瑞猎鹰智驾系统落地 - 奇瑞汽车兑现年初承诺,猎鹰智驾辅助系统已于年内实现全品牌全系车型搭载 [3] - 该系统在广州“魔鬼路”实测中,于老城区、城中村、极端复杂停车场等极限路况表现稳定,验证了技术落地的真实性 [3][16] - 全系标配L2+级以上智驾解决方案体现了公司在技术成熟度、成本控制与供应链整合方面的综合能力 [3][20] 猎鹰智驾技术底座 - 系统构建了“数据闭环-算法突破-硬件冗余”三重技术底座 [7] - 数据方面:天穹智算中心积累超过240亿公里驾驶辅助场景数据,并通过“全球实车验证(年20亿公里)+数字仿真验证(2000万公里/天模型学习)”双重模式实现高效迭代,算法迭代周期缩短至每周一次 [7] - 星海大数据平台依托1800万+全球用户,每年新增1000万+高价值训练数据,结合180万+世界模型生成场景,形成“真实数据+合成数据”双重供给 [10] - 算法方面:搭载Momenta R6强化学习大模型,采用“世界模型+强化学习”机制和“感知-规划-执行”一栈式决策架构,实现“拟人化驾驶” [10][11] - 硬件方面:以风云A9L为例,配备激光雷达、800万双目摄像头、毫米波雷达等形成冗余感知,联合算力达16Eflops,采用“算法优化+算力合理分配”的“够用即优”策略 [12][14] 奇瑞的智能化战略路径 - 公司拥有15年智能化技术积累,是中国最早布局智能化的车企之一,构建了覆盖智舱、智驾等全领域的千人研发体系 [17][19] - 采取“自主研发+开放合作”生态模式,与华为、Momenta、地平线等企业进行深度技术协同,而非简单供应商采购 [19] - 规模化落地策略旨在通过海量用户数据反哺系统迭代,形成“落地-数据-迭代-再落地”的良性循环 [19] - 根据规划,公司计划在2026年实现融合式端到端(VLA+WM),具备未来场景推理能力 [21]
中国智驾打响残酷突围战
华尔街见闻· 2025-11-27 20:17
行业核心观点 - 中国智能驾驶行业正经历激烈洗牌与权力版图重构 行业从百花齐放转向急速萎缩 市场不再相信PPT 唯有掌握百万级量产数据入口的玩家才有未来 [1] - 智能驾驶不再是锦上添花的配置 而是通往AGI(通用人工智能)时代的昂贵门票和船票 其终极目标是成为物理世界的大脑 [1][11][12] - 2025年是行业泡沫破裂的寒冬 也是价值回归的暖春 市场格局加速集中 最终可能仅剩两三家主要玩家 [14] 行业竞争格局与趋势 - 竞争维度已从比拼Demo转向比拼能否跨过“一百万辆”的物理门槛 达不到此量级的玩家将因数据单一而失去价值 [7] - 车企策略转变 不再盲目广撒网 而是整合内部资源或仅与极少数头部玩家深度绑定 [1] - 行业权力结构重塑 拥有“百万级”数据入口的玩家获得产业链绝对定价权 没有中间地带 要么做大成为平台 要么小而美后枯萎 [9][10] - 市场份额正加速向华为、Momenta、地平线等头部玩家集中 技术同质化、缺乏造血能力的腰部供应商正被出清 [14] - 未来格局将分为两类:掌握百万辆销量的自研派车企 以及服务于其余车企、通过联盟汇聚数据的超级Tier 1供应商 [15] 关键成功要素 - **数据规模是核心**:在端到端大模型时代 数据是算法进化的燃料 只有当车队规模达到百万级且日活足够高时 才能覆盖足够多长尾场景 驱动模型产生“智能涌现” [7] - **量产上车能力**:纯高速场景辅助驾驶难以形成有效数据闭环 商业模式存在问题 必须实现城市复杂场景的量产落地 [7] - **战略合作深度**:智驾供应商角色升级 从幕后零部件提供商转变为决定车型生死的战略合伙人 需要获得车企核心爆款车型订单 [8] 主要公司动态 毫末智行(负面案例) - 公司传出停工消息 其员工证实了该情况 [1] - 公司前身为长城汽车智驾系统前瞻部 2019年独立 曾获资本青睐 2021年一年内拿下两轮数亿元融资 [2] - 最新一笔融资为2024年上半年的超亿元B轮融资 但此轮融资已无长城汽车参与 [2] - 技术战略出现重大误判:硬件上押注重性价比的高通Snapdragon Ride芯片 而非行业主流的英伟达Orin 导致转向Transformer架构时适配困难 运行效率低下 [3];2023年7月行业风向转向“端到端大模型”时 公司技术高管仍公开持保留态度 错失技术代际升级时机 [3] - 客户开拓不力:除长城汽车外 对其他客户(如北京现代)的开拓不如人意 搭载其方案的车型屈指可数 [5] - 失去核心客户支持:因“PPT交付”等问题 长城汽车耗尽耐心 转而引入并独家投资了竞争对手元戎启行 [5] 元戎启行(正面案例) - 公司高调宣布拿下第三方辅助驾驶市场40%的份额 [1] - 从供应商焦灼战中胜出 拿下长城汽车核心车型订单 如魏牌蓝山、坦克500等 [7] - 为争取客户展现“狼性” 团队曾凌晨四点蹲守客户争取试驾机会 [8] - 搭载其方案的魏牌高山MPV月销量从年初的300台暴涨至2024年10月的近1万台 [8] - 技术路径上推出VLA(视觉-语言-动作)模型 使车辆具备思维链推理能力 以应对复杂路况 [11] - 推行“特斯拉路径” 利用量产乘用车数据和硬件升级实现L4 宣布使用成本仅20-30万的长城蓝山等量产车型落地Robotaxi 跑通其单位经济模型 [13] - 提出RoadAGI计划 目标是将智驾能力复用到人形机器人、物流机器人等更广阔的物理世界 [12] 卓驭科技(原大疆车载) - 公司获得一汽集团36亿元人民币的注资 拿到“国家队”背书 [1][8] - 交易核心价值在于保持独立运营的承诺 这使其能接入其他品牌数据 具备成为平台的价值 [9] - 一汽看中其性价比和开放性 在价格战惨烈的当下 这种能力是车企的救命稻草 [9] 地平线 - 公司副总裁称“每三台智能汽车中 就有一台搭载了地平线” [7] - 公司试图构建类似PC时代“Wintel”的芯片+算法生态联盟 [7] - 技术强调“直觉系统” 通过“一段式端到端”架构让车辆拥有类人的驾驶直觉 [11] - 与元戎启行类似 坚定选择“特斯拉路径” 利用量产车升级实现L4自动驾驶 [13] 技术演进与商业模式 - **技术范式转变**:行业从“高精地图+规则算法”时代 经“轻地图” 急速转向“端到端大模型”统治的下半场 [1][3] - **端到端大模型的核心价值**:让算法从僵硬执行代码 转变为能像生物一样流畅感知环境、博弈交互 甚至具备逻辑推理能力 [11] - **Robotaxi范式革新**:通过量产车数据和硬件实现L4的模式 打破了辅助驾驶与无人驾驶的界限 使Robotaxi从科研项目转变为消费级服务 粉碎了Waymo式重资产运营的壁垒 [13] - **“沿途下蛋”模式**:跑在路上的百万辆私家车既是出行工具 也是数据采集员 源源不断为高阶模型提供长尾场景数据 [13] - **智驾公司的终极愿景**:通过汽车训练端到端大模型和博弈策略 最终将能力复用到人形机器人等更广阔的物理世界 目标是成为物理世界的大脑 [12]
一周一刻钟,大事快评(W130):数据闭环
申万宏源证券· 2025-11-18 15:11
行业投资评级与核心观点 - 报告基于“科技+国央企改革”两条主线进行投资分析,推荐了多个细分方向的主机厂及零部件企业 [2] - 智能化被确定为2026年市场非常确定的主线之一,其投资机会不仅局限于智能驾驶,还包括Robotaxi等领域的溢出效应 [1][3] 数据闭环的核心观点 - 数据闭环是实现全栈自研的核心起点,其本质区别于单纯的数据收集(如年销300万台车产生的数据流),必须具备从海量数据中筛选有效信息、让机器读懂数据、反馈修正模型、OTA推送至车端并进行二次验证的完整循环能力 [1][3] - 构建数据闭环体系的核心难点在于对数据的标准化处理与模型训练,面对百万级甚至千万级的切片数据,必须依赖机器自动标注,训练一个初步可用的自动标注模型或需要数月时间 [1][3] - 当算法模型真正实现由PB级数据驱动时,将形成难以复制的竞争壁垒,为企业带来半年至一年的确定性领先优势,小鹏、理想及华为等头部企业已建立起半年至一年的领先优势 [2][4] 重点公司投资建议 - 推荐国内强α主机厂如比亚迪、吉利、小鹏 [2] - 智能化趋势下关注华为鸿蒙高端智能的典型代表:江淮汽车、赛力斯等,推荐理想汽车、科博达、德赛西威、经纬恒润 [2] - 国央企整合推荐关注上汽集团、东风集团股份、长安汽车 [2] - 推荐具备强业绩增长、机器人布局或海外拓展能力的零部件企业:福耀玻璃、新泉股份、福达股份、双环传动、银轮股份、无锡振华等,关注敏实集团、拓普集团 [2] 重点公司财务数据摘要 - 上汽集团2025年预测归母净利润为114.0亿元,预计同比增长584% [5] - 比亚迪2025年预测归母净利润为367.2亿元 [5] - 赛力斯2025年预测归母净利润为87.3亿元,预计同比增长47% [5] - 理想汽车-W 2025年预测归母净利润为115.6亿元,预计同比增长44% [5] - 小鹏汽车-SW 预计在2026年实现扭亏为盈,归母净利润达到24.0亿元 [5] - 零跑汽车 预计在2025年实现扭亏为盈,归母净利润达到6.9亿元 [5]
南开-镁信健康精算科技实验室发布mind42.ins
北京商报· 2025-11-17 09:52
文章核心观点 - AI技术驱动的健康险产业深度变革正在发生,重塑行业决策方式并重构产业价值链 [1] - 南开大学—镁信健康精算科技实验室发布商业健康险决策辅助大模型mind42.ins,旨在以人工智能技术重构健康险产品设计、风险定价与理赔管理 [1] 行业面临的挑战 - 健康险行业长期面临数据结构性复杂、标准不统一的挑战,每年产生数以亿计的医疗及药品理赔数据被割裂在不同系统中,形成数据鸿沟 [2] - 数据割裂导致三大行业难题:产品创新滞后、风险定价粗放、运营效率低下 [2] - 产品设计环节依赖静态数据和有限流行病学数据,缺乏对患者真实用药依从性、复查频率等动态风险的有效量化手段 [2] - 核保环节健康告知条目繁琐且专业表述不统一,核保人员主要依靠个人经验进行主观判断,影响评估准确性和一致性 [2] - 理赔运营面临复杂保险责任条款和药品适应症限制,人工审核效率低下,创新药理赔案例需提交上千页医疗资料,显著延长理赔周期并增加运营成本 [3] AI大模型mind42.ins的解决方案与应用 - mind42.ins标志着AI技术在健康险领域的应用从概念验证阶段迈入产业化落地新时期 [4] - 在产品研发环节实现从“经验推测”到“数据驱动”的范式转变,产品设计者可精准捕捉市场热点和用户需求变化 [6] - 系统能够自动生成销售辅助工具,直接提炼产品核心卖点并生成包括PPT、视频等多种营销素材,实现从产品概念到销售终端的无缝衔接 [8] - 在核保与理赔环节,依托自研ClaimMaster智能体,通过自然语言处理和图像识别技术自动解析医疗文书、核对保险责任、验证药品适应症 [8] - 常规理赔案件的审核时间从数日压缩到分秒级别 [8] - 系统构建完整数据闭环,实时追踪产品市场表现和理赔数据,通过对比分析实际理赔情况与精算假设差异为产品优化提供支撑 [9] 对行业产生的变革影响 - 改变行业创新节奏,产品创新周期从传统的数月缩短到数周,显著提升产品创新成功率 [10] - 重构行业竞争格局,通过提供标准化智能决策能力让不同规模保险公司享受技术进步红利,提升中小公司产品创新和市场竞争力 [10] - 推动健康险商业模式创新,基于更精准风险识别和定价能力开发个性化产品,如根据用户健康行为数据动态调整保费的产品或针对特定人群的定制化保障方案 [10] - 系统正从单一决策辅助工具向行业级基础设施升级,持续接入更多元数据源构建更立体用户健康画像 [10][11] - 随着大模型技术进步,系统将具备更强推理能力和领域知识,驱动保险产品向更高效、更多元、更个性化方向演进 [11]
理想ICCV'25分享了世界模型:从数据闭环到训练闭环
自动驾驶之心· 2025-11-07 08:05
公司智能驾驶技术发展路线 - 公司智能驾驶发展经历了从规则时代的轻图和无图方案 到基于人工智能的端到端+视觉语言模型快慢双系统和视觉语言自动驾驶方案 导航模块在四个方案中均为重点 [6] - 公司端到端量产版本的MPI已达到220+ 相比2024年7月底的版本提升了约19倍 [13] 数据闭环流程与规模 - 完整的数据闭环流程包括:影子模式验证、数据触发回传至云端、数据挖掘、有效样本自动标注、生成训练集训练模型、模型下发验证性能 [9] - 数据回传过程可在一分钟内完成 [10] - 公司已积累15亿公里的驾驶数据 通过200多个触发器生产时长15至45秒的片段数据 [11] 自动驾驶下半场:从数据闭环到训练闭环 - 行业观点认为自动驾驶进入下半场 核心玩法从数据闭环转向训练闭环 [18][21] - L4级训练循环的核心技术栈为视觉语言自动驾驶+强化学习+世界模型 轨迹由视觉语言自动驾驶的扩散模型和基于世界模型的强化学习共同优化 强化学习包括RLHF、RLVR和RLAIF [23] - 训练闭环关键技术栈包括区域级别仿真、合成数据和强化学习 [24] 训练闭环关键技术细节 - 仿真依赖场景重建技术 包括视觉/激光雷达重建、区域重建、多趟重建、场景编辑和风格迁移 [26] - 合成数据依赖多模态生成技术 包括视频/点云生成和神经渲染 [26] - 强化学习依赖智能体、3D资产以及评测与奖励模型 [26] - 可交互的智能体是训练闭环的关键挑战 [40] - 系统能力是世界模型增强引擎的关键 包括仿真环境、3D资产构建多样化场景、交互式行为建模、奖励模型反馈泛化能力及GPU工程加速推理 [41] 公司在重建与生成领域的进展 - 公司在重建领域已有两篇顶会论文成果 [28] - 公司技术方案从重建发展到生成 其中Feedforward 3DGS方案无需点云初始化 可直接由视觉输入得到结果 [29] - 公司在联合重建与生成领域有一篇顶会论文 [32] - 公司在生成领域有三篇顶会论文成果 [34] - 生成技术的应用包括场景编辑、场景迁移和场景生成 [36]
小红书获得支付牌照 或欲补齐关键金融基础设施短板
新京报· 2025-11-06 15:25
公司战略布局 - 小红书通过全资子公司宁智信息科技(上海)有限公司成功收购东方电子支付有限公司,获得100%股权及支付牌照[1] - 收购支付牌照的核心原因是补齐其商业生态的关键金融基础设施短板,为未来电商、本地生活及金融增值服务的规模化变现进行提前布局[3] - 公司在股权变更当日对东方支付进行巨额增资,注册资本从1.21亿元增至2亿元,增资幅度超过65%,以满足监管对实缴资本的硬性要求并释放深度运营支付能力的战略信号[3] 业务发展动因 - 作为内容驱动型平台,小红书电商业务快速增长,但长期依赖外部支付通道不仅抬高交易成本,更限制了用户行为数据闭环与资金流掌控力[3] - 从合规角度看,在当前监管明确要求强化平台主体责任的背景下,自持支付牌照已成为必然选择[3] - 获得支付牌照后,公司可将平台内高频交易场景(如直播打赏、商品购买、到店核销)的资金流切换至自有支付体系,并叠加分账、自动结算、营销红包等功能提升商户黏性[4] 标的公司财务状况 - 东方支付近期经营状况不乐观,2024年营收888万元,净亏损800万元;2025年上半年营收376万元,净亏损527万元[3] - 截至最新数据,东方支付资产总计1.32亿元,所有者权益9300万元[3] - 分析认为其经营问题源于缺乏客户和场景,没有真实交易流量支撑,仅靠通道分润难以覆盖合规与运维成本,但未来有了小红书平台加持,盈利将变得简单[3][4]