组合策略
搜索文档
为什么给机器人装上昂贵的触觉传感器,反而让它变笨了?
具身智能之心· 2025-12-04 08:04
文章核心观点 - 当前机器人多模态学习的主流方法——特征拼接(Feature Concatenation)在处理传感器信息稀疏或互补的任务时存在根本缺陷,会导致性能下降甚至失败[3][7] - 提出了一种名为“组合策略”(Compositional Policies)的新框架,通过为每个传感器模态训练独立的专家策略,并在策略层面进行组合,有效解决了传统方法的局限性[9][12] - 新方法在模拟和真实世界的多项机器人操作任务中,性能显著优于传统的特征拼接方法和单模态策略,并具备模块化、增量学习和运行时鲁棒性等优势[29][33][34] 当前多模态机器人学习方法的局限性 - **主流方法**:目前多采用特征拼接,即提取所有传感器的嵌入(embeddings),拼接成一个大向量后输入单一神经网络策略[5] - **根本缺陷一:稀疏信号被抑制**:在处理如“在黑暗背包中找钥匙”这类任务时,偶尔出现的关键信号(如触觉)在统计上被视为“噪音”而被网络过滤掉,导致增加传感器反而降低性能[3][16] - 实验数据显示,在遮挡抓取任务中,仅使用RGB视觉的成功率为35%,而增加触觉数据后,采用特征拼接方法的成功率暴跌至5%[3][16] - **根本缺陷二:缺乏模块化**:所有模态在特征层面紧密耦合,导致无法灵活添加或移除传感器[8][16] - 添加新传感器或移除故障传感器时,必须从头重新训练整个策略,成本高昂[16] - 单个传感器故障可能导致系统发生灾难性故障[16] 提出的解决方案:组合策略框架 - **核心思想**:放弃特征级拼接,转向策略级组合。为每个感官模态(如RGB、触觉、点云)训练独立的专家策略,然后学习如何组合它们的动作预测[9][17] - **工作原理**: - **模态特定专家**:每个专家是一个基于扩散策略/能量模型的实例,专注于自己的感官流,互不干扰[17] - **模态内分解**:在模态内部可进一步分解为互补的子策略(如视觉分为粗略几何和细粒度细节)[17] - **学习共识权重**:通过一个路由器网络(Router)学习预测权重,动态决定每个模态对最终动作的影响程度[17] - **关键优势**: - **解决稀疏性**:每个专家学习自己的动作分布,稀疏模态(如触觉)的专家可以高度专业化,不被其他模态干扰[12] - **模块化设计**:专家独立训练,添加新传感器只需训练新专家并与现有专家组合,无需重训整个系统[13] - **简单实现**:在扩散模型中,组合多个策略对应于概率分布相乘,等同于简单的分数函数相加[13] 实验验证与性能结果 - **模拟环境(RLBench)**:在四个操作任务上,组合策略方法的平均成功率为66%,显著优于单模态策略的49%和特征拼接方法的56%[29] - **真实世界实验(UR5e机器人)**: - **遮挡记号笔抓取**:组合策略成功率为65%,而仅RGB为35%,特征拼接方法仅为5%[34] - **勺子重定向**:一种灵巧的手内操作任务,组合策略成功率为75%,特征拼接方法为21%[34] - **拼图插入**:需要毫米级精度的任务,组合策略成功率为52%,特征拼接方法为40%[34] - **增量学习演示**:完全独立训练RGB和触觉策略后,使用固定相等权重组合(无联合训练),成功完成了单独策略都无法处理的遮挡记号笔抓取任务[15][18] 系统的鲁棒性与自适应性 - **运行时扰动**:在执行过程中突然抢走物体,机器人能适应并完成任务[21] - **传感器损坏**:遮挡一个摄像头模拟故障时,路由器网络将权重转移到剩余功能传感器上,系统表现保持稳定[23] - **物体重新定位**:移动任务相关物体后,策略能成功泛化到新位置[25]
固收深度研究:组合策略角度回撤情况如何?
国金证券· 2025-08-17 22:52
核心观点 - 报告认为8月债市急跌是风险偏好切换与产品浮盈偏薄共同作用的结果 长期利率债和超长信用债回撤显著 但负债端未出现系统性冲击 中短久期信用债表现稳健 短期策略建议关注价差交易和优质城投债机会 [6][45][70] 市场表现与回撤分析 - 上证指数触及3705点 活跃十年国债收益率最高升至1.75% 三十年超长特别国债逼近2% 8月以来估值净价跌幅达1.68% [3][13] - 30年国债组合最近一周亏损达192bp 年内收益转为-1.06% 10年国债组合亏损49bp 银行二级资本债和长久期信用组合回撤较大 [4][21] - 中短债防御优势显著 5年内信用债全价指数跌幅多在0.2%以内 满仓1年AA及AA(2)城投债组合近一周实现正收益 [3][4][21] 负债端稳定性分析 - 超长信用债流动性枯竭 近一周仅38笔成交 但基金通过增持1-3年银行永续债(单周规模57亿元)和减持3-5年二级资本债进行换仓 未出现全面负债冲击 [5][58][62] - 理财规模微降但持债行为延续 信用债单周买入规模超100亿元 仅3年内二级债有小幅卖出 [64][66][69] - 基金减持弱资质城投债规模低于年内调整阶段 重点省份AA/AA(2)/AA-城投债卖出规模未触及底仓资产 [5][63][65] 收益结构与策略建议 - 10年以上信用债收益位于去年以来20%分位数以上 距离年内低点均值17bp 中高等级中短久期信用债距离低点约10bp [52][55] - 4-5年国股行二级资本债定价逼近10年国债加点30bp上限 2.0%-2.05%为适宜参与区间 [7][73][74] - 城投新债供给收缩 建议关注3-5年隐含评级AA+以上优质城投债 一级定价过度偏离二级的新债存在博弈机会 [7][75][76] ETF与产品表现 - 信用类ETF产品累计收益率回落 做市商信用债ETF均值降至56bp 科创债ETF均值降至-27bp [32][34][37] - ETF换手率均值下降导致流通市值收缩 8只做市商信用债ETF流通市值出现负增长 科创债ETF流通市值波动率加剧 [38][40][47] - 中长期纯债基金收益中位数转负 最近一月利率债基与信用债基收益分别为-0.08%和-0.10% [32][33]