规划大模型
搜索文档
百度智驾方案解析
自动驾驶之心· 2026-01-13 11:10
百度自动驾驶技术架构 - 公司采用感知大模型与规划大模型相结合的架构 [2] - 系统采用端到端联合训练方式,从原始传感器时序数据直接到油门和转向控制输出 [3][5] - 联合训练确保感知部分的中间态数据以模型自身可理解的隐式数据空间形式,携带最佳信息丰度和准确度进入决策规划网络 [5] 端到端联合训练的具体实现 - 在端到端联合训练前,感知和规划分模型的独立训练与调整仍是必要的,以确保中间态数据符合人类对感知结果的判断标准 [5] - 联合架构中保留了感知网络的Decoder(如道路结构decoder、障碍物decoder)以及“显示三维向量空间”,以增加模型的可读性、可监督性和问题可追溯性 [5] - 规划侧切割出一个局部视图,用于处理更精细的规划任务 [6] 感知结果与决策规划的融合 - 显式的感知结果(人类独立训练下的感知输出,如道路参与目标状态和道路状态目标)与隐式的BEV特征数据一同被送入决策规划网络 [8] - 决策规划网络对显式三维向量空间进行Encoder编码,然后与隐式BEV数据联合送入Transformer模型 [8] - Transformer模型用于在大量数据间挖掘隐藏关系,寻找最佳轨迹匹配 [8] 系统整体方案 - 公司构建了包含数据闭环的系统解决方案 [9][10] - 系统解决方案涵盖感知系统与计算平台 [11] - 方案采用了全维冗余设计以提升系统可靠性 [13]
人形机器人技术多点突破,量产订单双提速
Wind万得· 2025-08-01 06:34
人形机器人技术进展 - 2025世界人工智能大会规模显著提升,展览面积首次突破7万平方米,吸引800余家企业参会,展示3000余项前沿展品,包括40余款大模型、50余款AI终端产品、60余款智能机器人及100余款"全球首发"或"中国首秀"新品 [4] - 机器人参展数量呈几何级增长,从去年18家增至今年超80家,其中人形机器人超150台,为国内最大规模集中展示 [4] - 大模型能力持续迭代,智元机器人灵犀X2具备深度语义理解与情感交互能力,银河通用机器人结合视觉-语言模型提升零售场景泛化能力,智平方AlphaBot展现跨设备执行能力 [5] - 科技企业加速布局,腾讯发布3个具身大模型(多模态感知模型、规划大模型、感知行动联合大模型),推动人形机器人从实验室走向真实场景 [6] - 运动能力显著提升,宇树科技G1机器人凭借29个关节完成高难度格斗动作,星动纪元实现毫秒级关节控制 [6] - 感知与操作能力突破,非夕机器人融合3D视觉与力控反馈完成鸡蛋雕刻,擎朗智能XMAN-F1实现爆米花制作与群组协作 [7] - 数据积累加速,国家地方共建人形机器人创新中心预计年底完成2500万整机数据积累(达谷歌同类数据集10倍),智元机器人启动业界首个具身智能操作系统开源计划 [7] 人形机器人商业化进程 - 工业场景应用深化,上海电气发布定制化人形机器人提升物流效率,开普勒深耕车厂制造与仓储物流领域 [8] - 医疗康养场景创新,傅利叶智能GR-3采用亲和设计主打交互陪伴,构建"具身智能康复港"模块 [8] - 商用服务场景多元化,擎朗智能XMAN-F1制作爆米花、银河通用Galbot精准识别商品、智元远征A2表演击鼓与导览 [8] - 量产计划密集推进,开普勒即将实现百台量产,智元灵犀X2预计2026年底出货量达数千台 [9] - 大型订单频现,智元机器人与宇树科技联合中标1.2亿元采购项目(国内最大单笔订单),优必选获9051万元订单刷新全球记录 [12] 投融动态 - 2025年国内人形机器人融资超80起,总金额超100亿元,以早期融资为主 [15] - 资本类型多元化:产业资本(美团、京东、宁德时代)战略投资绑定技术,地方政府基金(如湖北100亿元母基金)推动产业集群,专业风投(达晨财智、梅花创投)布局潜在回报 [15] - IPO进程激活市场预期,宇树科技启动辅导(投前估值超120亿元),智元机器人收购上纬新材63.62%股权或启动IPO [15] - 代表性融资案例:众警机器人A1轮近10亿元、干寻智能Pre-A+轮超6亿元、星海图A5轮超1亿美元、它石智航天使+轮1.22亿美元 [17]