持续学习

搜索文档
中科院自动化所最新综述!VLA模型后训练与类人运动学习的共性
具身智能之心· 2025-06-29 17:51
核心观点 - 文章从人类运动技能学习角度系统总结了VLA模型的后训练策略,提出环境、具身、任务三维分类框架,并探讨神经科学对机器人学习的启发[4][5][6] - VLA模型需通过后训练从通用预训练转向特定任务适配,类似人类从遗传能力到专项技能的转化过程[8][9] - 类脑视角下,后训练技术可划分为环境感知增强、具身认知优化、任务理解深化及多组件集成四大方向[10][12] VLA模型与后训练重要性 - VLA模型整合视觉、语言与动作生成模块,实现"看-听-动"闭环,但预训练模型在真实场景中需后训练提升精度与鲁棒性[8] - 后训练利用少量目标场景数据微调模型,使其适应机器人物理特性与任务需求,解决"开箱即用"性能不足的问题[9] 三维后训练策略 环境维度 - 引入可供性线索强化模型对环境交互可能性的理解,如物体功能暗示(门把手提示抓握)[12] - 优化视觉编码器与多模态感知融合,提升环境细节记忆与抗遗忘能力[12][13] 具身维度 - 建立机器人正向/逆向运动学模型,模拟人类前馈-反馈控制机制实现精准动作规划[14] - 借鉴小脑多内部模型协同机制,设计分层动作控制模块[14] 任务维度 - 通过人类示范数据注入专家知识,加速任务理解[14] - 采用层次化策略分解长程任务为可管理子步骤,对应人类分而治之的神经处理模式[14][17] 技术挑战与趋势 - 数据效率:需开发课程学习、主动采样等类人策略降低训练数据需求[22] - 多模态扩展:触觉/深度传感等新模态输入可提升环境交互真实性,但面临传感器融合难题[22] - 持续学习:当前离线微调易导致遗忘,需借鉴人类记忆机制开发终身学习框架[22] - 开放泛化:从实验室性能优化转向未知环境适应能力建设[22]
义乌商户晨练外语(经济新方位·外贸一线观察)
人民日报· 2025-06-02 06:03
义乌国际商贸城的多语种培训 - 浙江义乌国际商贸城每天早晨进行西班牙语、英语和阿拉伯语晨练培训,商户参与热情高涨[1] - 3月5日首期英语晨练培训班开课,4月7日新增阿拉伯语课程,近期加入西班牙语课程,多语种培训体系逐步完善[1] - 培训由义乌商城集团主办,旨在帮助商户提升外语能力以应对国际贸易需求[1] 义乌国际贸易数据表现 - 一季度义乌与拉丁美洲贸易额达273.1亿元,同比增长14.1%[1] - 一季度义乌与欧盟贸易额达163.6亿元,同比增长16.5%[1] - 贸易增长促使商户更加重视外语学习,特别是西班牙语等小语种[1] 商户学习态度与动机 - 商户傅江燕认为翻译软件不足以替代地道外语交流,掌握客户母语能增进信任促成合作[1] - 商户赵璐芳即使工作到深夜也坚持参加晨练,认为学习是保持竞争力的必要手段[1] - 义乌商户学习热情高涨,白天在商贸城学习,晚上还参加培训班[1] 义乌商业文化特征 - 义乌精神被提炼为"勤耕好学、刚正勇为、诚信包容"[1] - 商户将学习融入日常经营,从传统货郎转型为数字化时代的国际商人[1] - 持续学习不仅是个人成长需求,更是城市商业发展的重要推动力[1]
职场七年,我学会的一些事(上)
叫小宋 别叫总· 2025-05-26 08:34
职场本质 - 员工需创造高于薪资的价值 30万年薪需创造50万价值并锻炼70万年薪能力 [3] - 与高层互动需注重维护机构形象 包括倒茶夹菜及传递合伙人不便直说的信息 [3] - 解决问题能力是核心价值 提出困难而不解决会被质疑存在意义 [3][4] - 需从合伙人视角理解行业特质 更高阶的利益认知驱动决策 [4] 投资能力构建 - 行业Top3项目定义能力是关键 需通过精准定语说服投委会 [6] - 在信息高度对称环境下 需突破同事已Pass项目的跟进困局 [6] - 三年周期内需完成双重积累:简历充实+跨机构资源圈(项目方/FA/地方政府等) [6] - 高效工作方法论至关重要 包括精力分配与资源杠杆运用(如借力政府招商团队) [7] - 合伙人层级仍需持续学习 例如前瞻性布局太空光伏等新兴领域 [7] 交易撮合与利益平衡 - 交易方案需满足六方诉求:LP返投/合伙人隐性需求/企业发展/创始人/老股东/中介机构 [9] - 投资经理个人诉求排序靠后 包括KPI完成/产业资源积累/未来职业出路等 [10] - 行业本质是人性与利益博弈 需识别未言明的隐性利益并解决非标问题 [10] - 过度善良或心软可能成为职业障碍 "心慈手不软"是底线原则 [11]
LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能
机器之心· 2025-05-02 12:39
机器之心报道 编辑:张倩 LoRA 中到底存在多少参数冗余?这篇创新研究介绍了 LoRI 技术,它证明即使大幅减少 LoRA 的可训练参数,模型性能依然保持强劲。研究 团队在数学推理、代码生成、安全对齐以及 8 项自然语言理解任务上测试了 LoRI。发现仅训练 LoRA 参数的 5%(相当于全量微调参数的约 0.05%),LoRI 就能匹配或超越全量微调、标准 LoRA 和 DoRA 等方法的性能。 大型语言模型的部署仍然需要大量计算资源,特别是当需要微调来适应下游任务或与人类偏好保持一致时。 为了降低高昂的资源成本,研究人员开发了一系列参数高效微调(PEFT)技术。在这些技术中,LoRA 已被广泛采用。 不过,LoRA 仍然会带来显著的内存开销,尤其是在大规模模型中。因此,近期研究聚焦于通过减少可训练参数数量进一步优化 LoRA。 最近的研究表明,增量参数(微调后的参数减去预训练模型参数)存在显著冗余。受随机投影有效性和增量参数冗余性的启发,来自马里兰大学和清华大学的研 究者提出了带有降低后的干扰的 LoRA 方法—— LoRI(LoRA with Reduced Interference) 。 LoRI ...
为什么很多长期股票投资人都很长寿?
雪球· 2025-03-09 12:55
长按即可免费加入哦 风险提示:本文所提到的观点仅代表个人的意见,所涉及标的不作推荐,据此买卖,风险自负。 作者:金山投资笔记 来源:雪球 股票投资需要投资者不断学习和思考,以适应市场的变化。成功的股票投资人通常具备持续的学 习和思考能力,他们会关注市场动态、分析公司基本面、跟踪股票走势等。这种持续的学习和思 考不仅有助于他们在股市中做出明智的决策,也有助于他们的智力发展。研究表明,持续的智力 活动可以延缓大脑衰老,降低患阿尔茨海默病等症的风险。 四、丰富的业余生活 成功的股票投资人通常不会将所有精力都投入到股市中,他们还会注重培养自己的业余生活。例 如,他们可能会阅读、旅行、社交等,这些活动不仅有助于他们的身心健康,也有助于他们的社 交能力和人际关系。良好的社交关系和丰富的业余生活可以增加生活的乐趣和满足感,有助于延 长寿命。 很多长期股票投资人之所以长寿,可以从以下几个方面进行分析: 一、良好的心态 股票投资是一项高风险的活动,需要投资者具备良好的心态。成功的股票投资人往往能够克服贪 婪、恐惧等人性弱点,保持平静的心情,冷静、理智地思考。这种心态不仅有助于他们在股市中 做出明智的决策,也有助于他们的身心健康 ...