Workflow
场景泛化
icon
搜索文档
当下自动驾驶的技术发展,重建还有哪些应用?
自动驾驶之心· 2025-06-29 16:19
4D标注之静态元素 - 自动驾驶技术发展推动重建应用从SLAM转向4D标注 静态元素标注只需在重建3D场景中标注一次 大幅提升效率[1] - 静态元素标注输入为Lidar或多摄像头重建的3D图 输出为矢量车道线(由N个有序xyz坐标点组成)和类别[5] - 地面重建获取2D BEV车道线 静态点云重建获取3D障碍物信息[6] 重建技术流程 - 激光/视觉里程计获取自车位姿 地面语义分割采用SAM等开源模型[7] - 地面重建采用RoME方法 将语义投影到网格化点云 静态场景点云重建完成整体构建[7] 4D自动标注核心难点 - 时空一致性要求高 需连续帧精准追踪动态目标运动轨迹[8] - 多模态数据融合复杂 需解决激光雷达 相机 雷达的坐标对齐和时延补偿[8] - 动态场景泛化难度大 交通参与者行为不确定性和环境干扰增加模型挑战[8] - 标注效率与成本矛盾 高精度标注依赖人工校验但海量数据导致周期长[8] - 量产场景泛化要求高 需适应不同城市 道路 天气等复杂条件[8] 4D标注课程体系 - 动态障碍物标注涵盖3D检测算法(SAFDNet) 多目标跟踪(DetZero)及数据质检[12] - 激光&视觉SLAM重建讲解Graph-based算法和评价指标[13] - 静态元素标注基于全局clip道路信息实现自动化[15] - 通用障碍物OCC标注解析特斯拉Occupancy Network方案及稠密化优化[16] - 端到端真值生成打通动态障碍物 静态元素 可行驶区域和自车轨迹[17] - 数据闭环专题涵盖scaling law验证 架构痛点及岗位面试要点[19] 行业技术趋势 - 4D标注算法向端到端发展 实现动静态元素 可行驶区域的全流程自动化[17] - OCC技术成为感知标配 基于Lidar和视觉的方案持续优化[16] - 数据闭环能力成为企业核心竞争力 涉及算法研发和工程化落地[19][21]
星海图高继扬:具身智能下半场,应用为王
Founder Park· 2025-06-23 19:44
具身智能行业发展趋势 - 2026年将是具身智能的下半场,核心是应用,供需两侧正在走向成熟[1][34] - 行业已度过全民探索可用场景阶段,市场预期回归理性,应用场景逐渐清晰[1][33] - 当前阶段最有商业价值的是实现对象泛化和动作泛化,而非本体泛化[3][26][27] 具身智能技术发展瓶颈 - 发展缓慢的根本原因是高质量数据缺失,而数据缺失源于缺乏合适的标准本体[4][10] - 需要从电机、整机、遥操作、数据管线到模型五个层面全面成熟[10] - 具身智能是"没有短板的游戏",需要软硬件深度结合,从电机到模型的完整整合[4][5] 数据采集与模型训练 - 将数据采集视为生产活动,已部署几十台机器人在真实场景采集数据[17] - 到第三季度将累计获得1万小时交互数据,覆盖1000+操作对象和300+任务[18] - 预训练解决"本体与物理世界交互的基本法则",需要几千到上万小时交互数据[21][23] - 采用"快慢结合"模型结构,快执行模型参数量约10亿,慢思考模型达百亿级[22] 产品形态与商业化路径 - 核心产品形态是"整机+预训练模型+后训练工具"组合[6][9] - 商业闭环核心在于开发者群体,应用繁荣才能创造价值[28][29] - 计划在2023年8月WRC和9月CoRL开源基础模型和数据集[30] - 当前操作精度达厘米级,速度为人类70-80%,新任务学习需约100条样本[32] 技术指标与泛化能力 - 定义四个泛化维度:对象、动作、场景和本体泛化[24] - 对象泛化指对不同物品执行相同动作,动作泛化指对同一物品执行不同操作[26] - 工站式场景降低了对场景泛化的需求,本体泛化在现阶段商业重要性较低[26][27]