Workflow
具身AGI
icon
搜索文档
迈向通用具身智能:具身智能的综述与发展路线
具身智能之心· 2025-06-17 20:53
具身AGI的定义 - 具身AGI被定义为能够以人类水平的熟练度完成多样化、开放式现实世界任务的具身AI系统,强调其人类交互能力和任务执行能力 [3] 通用具身智能路线 - 论文提出从L1到L5的五级路线图,衡量和指导具身AGI的发展,每个级别基于四个核心维度:模态、类人认知能力、实时响应能力和泛化能力 [4] - L1(单一任务完成):机器人能够可靠地完成单一、明确定义的任务,但功能局限于特定任务领域 [7] - L2(组合任务完成):机器人能够处理组合任务,通过将高级人类指令分解为简单动作序列来执行,但能力仍限于预定义任务和技能库 [7] - L3(有条件的一般任务完成):机器人能够处理多种任务类别,表现出对任务、环境和人类指令的有条件泛化能力,但对全新或开放式任务的可靠性不足 [7] - L4(高度通用机器人):机器人展现出对广泛未见任务的稳健泛化能力,具备强大的多模态理解和推理能力 [7] - L5(全功能机器人):机器人能够满足人类日常生活的广泛需求,展现出类似人类的认知行为 [7] 现状和挑战 - 当前具身AI的能力处于L1和L2之间 [7] - 现有的具身AI模型大多仅支持视觉和语言输入,并且输出仅限于动作空间 [8] - 现有的机器人主要专注于任务特定的操作,缺乏高级的推理和社交互动能力 [11] - 大多数现有的具身AI系统以半双工方式运行,即在完全接收和处理指令后才开始行动,这使得它们在动态环境中表现不佳 [14] - 具身AI需要在推理和对话智能方面表现出色,类似于复杂的聊天机器人,并展示与人类偏好和伦理价值观的一致性 [17] L3∼L5核心能力组件 - 全模态能力:L3+机器人需处理超越视觉和文本的多模态输入(如听觉、触觉、热感等),并生成多模态响应(动作、语音、推理等) [18] - 类人认知行为:包括自我意识、社会关联理解、程序性记忆和记忆重组 [18] - 实时交互:现有模型因参数量限制难以支持全模态实时响应,且计算复杂度随序列长度平方增长 [19] - 开放任务泛化:当前模型依赖任务特定数据,缺乏物理规律的内化 [19] L3+机器人大脑框架 - 模型结构设计原则包括全模态流式处理和动态响应 [19] - 训练范式包括全模态从头训练、终身学习集成和物理导向训练 [20] 总结与未来挑战 - 具身AGI的发展路线图具有长期相关性 [20] - 未来挑战包括技术障碍以及伦理、安全和社会影响等方面的挑战 [20]
机器人行业周报:联想、美的等大厂加速布局人形机器人-20250511
西南证券· 2025-05-11 13:30
报告行业投资评级 - 强于大市(维持) [1] 报告的核心观点 - 本周(5月5日 - 5月11日)机器人指数跑输大盘,中证机器人指数上涨1.6%,跑输上证指数0.3个百分点,跑输沪深300指数0.4个百分点,跑输创业板指1.6个百分点 [5][12] - 联想、美的等大厂加速布局人形机器人,行业动态丰富,包括高校采购、企业产品落地、赛事举办、模型开源、新机器人推出及企业融资等 [1][5] 各目录总结 行情回顾 - 本周机器人指数跑输大盘,中证机器人指数涨1.6%,跑输上证指数0.3个百分点、沪深300指数0.4个百分点、创业板指1.6个百分点 [5][12] - 展示了机器人各细分板块行情回顾,如减速器、电机、丝杠等环节部分公司的市值、本周收盘价、涨跌幅、25E归母净利及25E对应PE等数据 [14][15] 产业动态 - 同济大学采购10台宇树通用人形机器人(型号:H1 - 2),中标金额8256600元,此次采购在众多高校中数量最多、金额最大 [5][16] - 美的自主研发的类人形机器人5月进湖北荆州洗衣机工厂,用于机器运维等场景,下半年进线下门店,用于商业导览等场景,产业化或需3 - 5年 [5][17] - 联想在“联想Tech World 2025创新科技大会”发布“联想乐享壹号”人形机器人,展示了肢体协调和业务问答能力,此前能与顾客互动 [5][20] - 2025世界人形机器人运动会8月15 - 17日在北京“双奥场馆”举行,分主体赛事和外围赛事,有明确参赛条件和规定 [5][23] - 清华大学叉院ISRLab与星动纪元开源首个AIGC生成式机器人大模型VPP,优势显著,将推动机器人技术发展 [5][24] - 亚马逊推出首款触觉机器人Vulcan,能处理仓储中心约75%商品,计划未来几年在欧美站点部署 [5][25] 融资动态 - 傲鲨智能完成数千万元B轮融资,由彬复资本领投,老股东国仪资本跟投,融资用于产品线拓展等,巩固双轨竞争力 [5][27]
快讯|2025世界人形机器人运动会8月落地北京;清华、星动纪元开源首个AIGC机器人大模型;亚马逊推出首款触觉机器人Vulcan
机器人大讲堂· 2025-05-08 14:38
1、 2025世界人形机器人运动会8月落地北京"双奥场馆" 近日,2025世界人形机器人运动会定于今年8月15日至17日在北京国家体育场(鸟巢)和国家速滑馆(冰 丝带)举行。据悉,该赛事由中央广播电视总台等多方联合主办、承办。比赛项目分主体赛事和外围赛 事。主体赛事有竞技赛、表演赛和场景赛共19个项目。竞技赛参照人类传统体育,设田径等11个小项,考 验机器人运动等能力;表演赛设单机、群体舞蹈,展示协同能力;场景赛聚焦工业、医院、酒店场景,设 6个项目,凸显机器人实用技能。外围赛事有非人形机器人参与的羽毛球等3个项目,侧重表演与互动。参 赛机器人需满足自研或采购、独立整体等六个条件,参赛队伍方面,国内外相关单位均可报名,对参赛队 人数、参赛项目数量及比赛时的人员进入场地等也有明确规定。 2、 清华、星动纪元开源首个AIGC机器人大模型 近日,AI领域迎来新突破,清华大学叉院ISRLab与星动纪元开源首个AIGC生成式机器人大模型VPP(Vi deo Prediction Policy),该成果获ICML2025 Spotlight。据悉,VPP利用大量互联网视频数据训练,学 习人类动作,降低对高质量机器人真机数 ...