自动驾驶端到端模型
搜索文档
独家解读|2025年AI五大趋势与底层数据革命
机器之心· 2026-01-06 17:38
文章核心观点 - 2025年人工智能的发展重心正发生根本性转移,从追求模型规模转向构建其理解与解决复杂现实问题的能力,高质量数据成为定义AI能力的新基石[1] - 数据堂作为人工智能数据服务的前沿探索者,深度参与并支撑着这场变革的每一个关键环节[1] 趋势一:多语种TTS与全双工交互 - 语音合成技术正同时向两个深度智能化维度演进:一是为合成语音注入情感、个性与文化适配性;二是从单向反应升级为支持实时打断、重叠对话与上下文连贯的全双工自然交互[3] - 训练数据的重心正经历双重跃迁:一方面需构建服务于音色、韵律、情感和风格精细控制的“表现力语料库”;另一方面为实现全双工交互,迫切需要多通道、真实、带有自然打断与话题转换的对话语音数据[4] - 数据堂提供可直接用于模型训练的成熟数据集,包括100万小时多语种自然对话语音数据集、300万条前端文本库、2000小时多情感普通话合成数据集以及1万小时全双工多语种自然对话数据集[7] - 依托覆盖全球200+语种及方言的庞大语音资源网络与专业声优库,数据堂能够为各类定制化项目提供强大支持[7] 趋势二:多模态大模型 - 以DeepSeek-OCR模型的开源为标志性事件,揭示了多模态大模型发展的核心方向:推动AI从处理单一模态信息,迈向对图像、文本、表格、图表、GUI界面等多元信息进行统一理解、关联分析与深度推理的新阶段[9] - 训练数据必须能够刻画不同模态元素之间的复杂关联与深层语义逻辑,朝着跨模态语义对齐、深度结构化与语义图谱化的方向演进[10] - 数据堂提供覆盖多模态认知全链条的高质量数据,包括千万级OCR数据、百万级GUI界面、多领域专业文档、300万组涵盖动作、场景、建筑等的图文理解数据,以及20万组OCR问答及图像视频编辑数据[12] 趋势三:大模型的深度演进 - 当前大模型的发展呈现出两条清晰且并行的路径:一方面持续追求更强大的通用推理与复杂常识能力;另一方面驱动模型向金融、法律、生物医药等垂直领域深入,追求高度的专业精度与可靠性[14] - 高质量训练数据的需求正高度集中于金融、法律、生物医药及科学研究等知识密度高、容错率低的专业领域,核心已转变为获取能直接赋能模型专业推理与精准判断能力的关键数据资产[15] - 数据堂提供从标准化数据产品到深度定制服务的完整解决方案,包括5000万条新闻文本、3亿条STEM试题等高质量无监督数据,以及70万组指令微调与150万条安全内容等SFT指令微调数据[17] - 数据堂组建了覆盖十余个领域的超500人专家团队,已成功支持超100个大模型数据项目[17] 趋势四:具身智能 - 具身智能成为2025年焦点,旨在突破传统大模型缺乏物理交互经验、无法建立真实世界因果认知的本质缺陷[19] - 具身智能的核心在于让AI通过数据习得物理世界的因果规律,这需要严格对齐时序的高维交互数据,完整融合多视角视频、高精度力/触觉传感器流、动作指令序列及最终任务结果[20] - 数据堂提供从标准化数据集到深度定制采集的完整服务,目前已构建数亿组3D环境数据、第一人称任务视频、机器人抓取数据集等在内的完整体系[22] - 数据堂在全球布局超过20个专业采集场,单个面积最大超4000平方米,部署有包括人形机器人、机械臂、机械狗在内的70余台各品牌机器人[22] - 数据堂专业标注平台与团队能够完成从感知数据的目标检测、分割,视频分割,任务描述,COT等全类型标注任务[23] 趋势五:自动驾驶的技术范式转移 - 2025年,自动驾驶系统正经历一场深刻的技术范式变革,核心架构正从传统的“感知-规划-控制”模块化设计,向数据驱动的“端到端”一体化模型演进[25] - 新一代的VLM/VLA多模态大模型路径提出了颠覆性需求,训练数据必须实现视觉、语言与行动三者在时序上的精细对齐与深度耦合,催生了对高质量、强逻辑的标注数据的极度依赖[26] - 数据堂能够对驾驶场景同步执行端到端的精确坐标标注与粗粒度的语义说明标注,并融合场景描述、决策依据、反思过程等深度逻辑,构建“感知-决策”闭环的训练数据对[28] - 基于高效的标注工具及成熟的流程管理,数据堂具备稳定的规模化标注产能,其中车辆路线判断与行驶意图等关键任务的量产交付能力均达到每月40万组[28]
速腾聚创(02498):激光雷达领军再一程,迈向机器人技术平台公司
申万宏源证券· 2025-05-13 21:20
报告公司投资评级 - 首次覆盖,给予“增持”评级 [2][7] 报告的核心观点 - 速腾聚创厚积薄发,领跑全球激光雷达行业,致力于在具身智能领域提供解决方案,近年激光雷达销量高增,2024年份额领先,产品矩阵完备 [6] - 车载端到端算法成熟,激光雷达与算法融合,2025年进入“千元机时代”,价格下探提升配置率,预计2025年全球乘用车激光雷达市场空间约70亿,中国市场约63亿 [6] - 战略定位机器人技术平台,聚焦机器人视觉等增量零部件开发,2025年被视作人形机器人量产元年,割草机器人细分市场对激光雷达需求增长,预计2025年超40万台,2028年超90万台 [6] - 预计公司2025 - 2027年营业收入为26.2/36.6/47.0亿元,归母净利润为 - 2.38/1.06/3.20亿元,采用PS估值法,给予2025年7.4倍PS,对应目标市值约194亿,首次覆盖给予“增持”评级 [6][7] 根据相关目录分别进行总结 1. 双轮驱动的激光雷达头部厂商 1.1 销量高增:成为全球头部激光雷达厂商 - 速腾聚创成立于2014年,是AI驱动的机器人技术公司,致力于成为全球领先的机器人技术平台公司 [18] - 2024年激光雷达总销量约54.4万台,同比增长109.6%,其中ADAS应用约52万台,机器人及其他领域约2.44万台 [22] - 2024年以26%的市场份额位居全球乘用车激光雷达市场第一,已与全球30家整车厂及Tier1达成合作,定点车型超百款,加速拓展海外市场 [25][29] - ADAS激光雷达单价从2023年约3200元降至2024年不到2600元,机器人及其他领域从超11000元降至超8000元 [32] - 2024年整体毛利率达17.2%,ADAS和机器人及其他领域毛利率分别为13.4%/34.5% [33] - 产品矩阵完备,涵盖多种技术路径、性能和应用场景,满足广泛需求,在机器人领域也构建了丰富产品体系 [41][43][44] 1.2 系统复杂:产业化需硬核实力支撑 - 激光雷达技术迭代中,方案设计能力是降低成本和缩小体积的核心,数据复杂度高对软件技术有要求,生产制造过程复杂对厂商综合实力要求高 [47][51][53] - 速腾聚创拥有出色的方案设计能力、软件技术及量产能力,专注自研芯片激光雷达技术,有人工智能感知软件HyperVision,M系列产品通过验证测试,供应链和制造中心稳健 [54] 2. 驱动力一:车载端到端+智驾平权 - 此前激光雷达配置因特斯拉纯视觉路线存在争议,但其路线独特性归因于大量数据和用户基础,在“BEV+Transformer+Occupancy Network”算法框架下推出端到端量产上车算法 [59] - 在算力增强、端到端算法成熟背景下,多传感器融合和纯视觉路线不再对立,激光雷达等传感数据与端到端算法融合,英伟达Hyperion 9 Platform参考架构中激光雷达作为传感器输入 [63][65] - 2024年多家领军公司宣布应用“端到端”量产,激光雷达在国内主流方案均配备,中国市场激光雷达配置必要性更强 [67] - 2025年激光雷达进入“千元机时代”,价格下探提升配置率,向低价位渗透趋势明显,核心价格区间降至25 - 30万 [68][72] - 预计2025年全球乘用车激光雷达市场空间约70亿,中国市场约63亿,海外市场将是重要增量方向 [75] 3. 驱动力二:战略定位机器人技术平台 - 在具身智能领域,聚焦机器人视觉、灵巧手等增量零部件开发,推出操作和移动解决方案,计划推出数字化激光雷达产品和智能化方案“Robo - FSD” [78] - 开发的增量零部件包括机器人视觉、触觉、关节,如发布Active Camera首款产品AC1及AI - Ready生态,开发力传感器FS - 3D、高功率密度直线电机LA - 8000和机器人域控控制DC - G1 [81][86] - 2025年被视作人形机器人量产元年,特斯拉目标生产5000台Optimus,国内企业实现千台级交付,随着产业链成熟成本有望降低 [84] - 割草机器人市场发展特色明显,预计2025年对激光雷达需求量超40万台,2028年超90万台 [95][99] 4. 盈利预测和估值 - 预计2025 - 2027年收入分别为26.2/36.6/47.0亿元,增速分别为58.9%/39.5%/28.5% [106] - 假设ADAS领域激光雷达2025 - 2027年销售收入为21.4/30.9/40.3亿元,增速分别为60%/44.5%/30.5%;机器人领域激光雷达销售收入为3.57/4.29/5.14亿元,增速分别为80%/20%/20% [8][107][108] - 预计2025 - 2027年归母净利润为 - 2.38/1.06/3.20亿元,各项费用率有望持续下降 [112][113] - 采用PS估值法,选取禾赛科技、优必选、Mobileye作为可比公司,给予2025年7.4倍PS,对应目标市值约194亿 [7]