Workflow
Atlas机器人
icon
搜索文档
为啥机器人集体放弃“跑酷” 全去“叠衣服”了?
机器人大讲堂· 2025-11-24 23:00
行业风向转变 - 机器人行业从展示跑酷、跳舞等极限动作转向专注于叠衣服等家务任务[1][3] - 企业减少概念炒作,开始关注市场需求,技术演示更务实[7] 技术演示案例 - Figure 03使用五指手叠毛巾,但边角容易卷起[5] - Weave Robotics的半自动叠衣视频采用2倍快进,实际速度偏慢[5][20] - 谷歌ALOHA挂衣演示未剪帧,动作缓慢且对齐衣架有困难,但因真实感获得认可[8] - Dyna Robotics让机器人连续18小时叠餐巾,展示单一任务的执着[8] 技术突破驱动 - 十年前PR2机器人需固定绿色背景才能叠简单衬衫,动作缓慢且环境适应性差[9] - 扩散模型和零样本学习成熟后,机器人无需逐步骤编程,仅凭几千条人类演示数据即可学会叠衣[13] - 谷歌ALOHA仅用6000条系鞋带演示数据就让机械臂学会精细操作,叠衣服容错率更高且数据收集更简单[13] - HuggingFace、LeRobot等生态系统降低技术门槛,初创团队可借助预训练模型快速开发演示[13] 市场需求匹配 - 叠衣服是刚性需求,许多用户愿意为此付费,家庭场景价值感知度高[15] - 相比工业场景,家用叠衣落地路径更清晰,容错率高,试错成本低[15] - 任务失败仅需重新摆放衣物,不易损坏设备,适合资金有限的初创团队打磨技术[15] 当前技术局限 - Figure 03叠衣时放得太快,边角卷翘,机器人无法感知衣物材质和受力情况[18] - 1X Technologies的Neo机器人动作僵硬,缺乏人类灵活调整的能力[20] - 演示多在实验室固定环境中进行,桌面纯色平整,衣物单一,背景无干扰[22] - 真实家庭环境复杂,衣物可能混搭,桌面杂乱,光线变化,机器人对齐衣架困难[22] - 企业关注“能否做到”,用户更关心“能否做好”,如是否损坏真丝衬衫、5分钟内叠完一篮衣物等[24] - 当前演示仅完成“折叠”动作,未涉及取衣、整理、收纳等关键步骤[24] 行业发展逻辑 - 早期跑酷、跳舞演示旨在秀肌肉,吸引资本和行业热度[27] - 叠衣赛道爆发标志行业从“我能做什么”转向“用户需要什么”[27] - 工业机器人巨头如发那科、安川的成功在于围绕真实需求研发,如焊接精度和搬运效率[27] - 人形机器人需先解决用户刚需痛点,再拓展复杂功能,遵循市场需求导向的发展逻辑[27] 未来技术方向 - 需优化算法和升级硬件,解决感知精度不足、操作不灵活等问题[29] - 《Science Robotics》论文提出机械臂24小时学会1000项任务的方向,通过高效算法减少数据依赖,提升环境适应性[29] - 技术成熟后,机器人可能从叠衣服拓展到洗碗、擦窗、整理衣柜等更多场景,但需始终围绕用户需求[29] 行业价值回归 - 技术价值在于解决日常真实问题,而非突破极限[30] - 企业应聚焦用户诉求,提升折叠速度、操作精度和场景适配性,实现从取衣到收纳的全流程自动化[30] - 当家务机器人成为日常,人形机器人才能真正实现商业价值[30]
2025中关村具身智能场景应用赛:自主+遥操双模式竞技实战见分晓!
机器人大讲堂· 2025-10-17 17:37
具身智能行业应用现状 - 具身智能正通过人工智能与实体交互的深度融合,在各领域转化为实际生产力[1] - 工业场景中,波士顿动力Atlas机器人可精准排序零件,中科慧灵CASBOT W1机器能快速切换不同产品适配生产,1小时即可完成切换,星动纪元STAR 1人形机器人可精准完成汽车零部件装配场景中的螺丝紧固等复杂作业[1] - 智慧服务领域,灵心巧手Linkerbot钢琴机器人指尖力控精度与灵活度已超越人类手指极限,银河通用Galbots机器人支撑的"银河太空舱"快闪店单舱日均可服务2000人次[1] - 能源巡检领域,云深处科技"绝影X30"四足机器人可无惧恶劣环境,细致巡检变电站[1] 2025中关村具身智能机器人应用大赛概况 - 大赛核心赛道具身智能场景应用赛以推动机器人真正能"干活"为目标,覆盖工业制造、商用服务、家庭服务、应急处置四大核心场景[3] - 赛项分为自主完成与遥操作完成两大类,共6个细分赛项、15项单独任务,每项任务均模拟真实工作场景设计[6] - 大赛设赛事奖金总计200万元,具身智能场景应用赛15个单项任务每项设一等奖5万元、二等奖3万元、三等奖2万元,另设创新激励奖金5000元[25] - 获奖团队若落地海淀发展,可享受基金、人才、空间等配套政策支持[27] 大赛赛程安排 - 大赛分为报名阶段、初赛阶段、决赛阶段,报名通道已于7月15日开启[4] - 初赛定于11月4-5日,场地按赛项类型划分为东升赛区和温泉赛区[8] - 东升赛区负责工业制造场景(自主完成)、居家服务场景(自主完成)、家庭服务场景(遥操作完成)三项赛项中的7项单独任务[8] - 温泉赛区负责商用服务场景(自主完成)、工业制造场景(遥操作完成)、安全处置场景(遥操作完成)三项赛项中的8项单独任务[8] - 决赛定于11月17日-18日举办,参赛团队可于决赛前5-10天进行现场模拟训练[9] 自主完成类赛项规则 - 自主完成类赛项要求机器人控制方式必须完全自主,全程无人工干预,重点考察自主导航、多模态感知、精准操作等核心能力[10] - 涵盖3个应用场景、8项单独任务,各任务均限时30分钟[10] - 工业制造场景(自主完成)设置车身检测、物料分选、关节组装3项任务,模拟汽车制造、零部件加工等真实场景,场地尺寸为长15m、宽8m[10] - 商用服务场景(自主完成)设置咖啡制作、药品拣选、超市开柜3项任务,考验机器人双臂协作、力控精度与指令理解能力[13] - 居家服务场景(自主完成)模拟日常家庭需求,设置递送物品、安全监测2项任务,考验机器人语音交互、环境风险识别能力[14] 遥操作完成类赛项规则 - 遥操作完成类赛项允许人工通过遥控干预机器人,但仅能依靠机器人本体传感器感知环境,重点考察人机协作效率、复杂场景适应性[17] - 涵盖3个细分场景、7项单独任务,各任务限时20分钟[17] - 工业制造场景(遥操作完成)设置原料搬运、零件装配2项任务,模拟工厂原料转运、零件组装场景[17] - 家庭服务场景(遥操作完成)设置衣服晾晒、桌面清洁、垃圾拣选3项任务,还原家庭日常家务流程[19] - 安全处置场景(遥操作完成)设置表数读取、危险物品识别与抓取2项任务,模拟电力巡检、危险物品处理等高危场景[20] 参赛策略建议 - 建议参赛团队优先选择匹配技术优势的任务,若机器人擅长高精度抓取可重点备战"关节组装"、"药品拣选"[23] - 避免"过度挑战",例如遥操作类的"10kg原料搬运"虽得分更高但需确保机器人承重能力达标[23] - 合理分配备赛精力,若报名多个任务优先攻克"时间优先类任务"如咖啡制作、桌面清洁,这类任务完成时间直接决定排名[23] - 自主完成类需强化"感知-决策-执行"闭环,可优化视觉算法减少误判,针对特定任务加装力控传感器或柔性抓手[23] - 遥操作类需优化"人机交互效率",遥控界面建议设计简洁,设置高频动作快捷键,确保传感器数据实时回传[24] 行业参与企业 - 工业机器人企业包括埃斯顿自动化、埃夫特机器人、非夕科技、法奥机器人、越疆机器人等[35] - 服务与特种机器人企业包括亿嘉和、晶品特装、七腾机器人、史河机器人、九号机器人等[35] - 医疗机器人企业包括元化智能、天智航、思哲睿智能医疗、精锋医疗、佗道医疗等[36] - 人形机器人企业包括优必选科技、宇树、云深处、星动纪元、伟景机器人、逐际动力等[37] - 具身智能企业包括跨维智能、银河通用、千寻智能、灵心巧手、睿尔曼智能、科大讯飞等[38] - 核心零部件企业包括绿的谐波、因时机器人、坤维科技、脉塔智能、青瞳视觉等[40]
书评丨当代码学会呼吸
21世纪经济报道· 2025-05-24 00:44
人机沟通与认知革命 - 波士顿动力Atlas机器人完成第37次情绪识别算法升级,显示机器已具备理解人类表情的能力,但人类尚未形成与机器平等对话的能力[1] - 人机沟通存在单向解码风险:当机器学习人类沟通密码时,人类可能面临被反向解码的哲学命题[1] - MIT研究显示对话系统在语用层达到人类自然交流63%匹配度时,人类对智能机器的信任度出现指数级跃升[6] 计算机与人工智能发展史 - "computer"一词最初指用铅笔和纸从事计算工作的人,AI思想与实践始终伴随计算机发展[3] - 图灵1950年论文提出AI测试标准,AI术语1956年出现,当前进步依赖GPU计算能力加速[3] - 计算机bug概念源自20世纪40年代格蕾丝·霍珀发现的电子管硬件故障飞蛾事件[4] 机器智能的边界与局限 - 机器在重复计算(如递归算法)方面远超人类,但面对模糊目标或数据缺失领域仍束手无策[4][5] - 当前AI无法具备人类情感、情绪和潜意识,可能放大人类偏见(0.03%训练数据偏见经2000次迭代可形成17%系统性歧视)[5][6] - 数学理论可讨论N维空间而计算机能模拟,但人类自然认知边界局限在三维空间加时间维度[4] 人机协作的范式变革 - 人类沟通包含语法层、语义层、语用层三维度,AI在多模态模型支持下已实现前两个层次的深入沟通[6] - 机器模仿人类语言行为将引发跨越物种的沟通变革,可能重新定义"何以为人"[6] - 未来很长时间人类仍是机器老师,需干预机器放大社会不平衡的风险[5]
特斯拉 Optimus 机器人进展:已经生产数百台、还拧不好螺丝
晚点LatePost· 2024-09-25 23:56
核心观点 - 马斯克对特斯拉人形机器人Optimus的愿景是造出成本低于2万美元、能替代部分工人工作的终极形态产品,而非逐步迭代的机械装置 [3][4] - 特斯拉采取与行业相反的开发路径:坚持完全人形设计(包括女性手指锥度、1米73身高等细节),拒绝轮式或模块化工具等折中方案 [5][8] - 当前Optimus仍处于早期阶段:已生产数百台但仅用于数据采集,行走测试通过率不足60%,单台成本约10万美元且手动组装 [3][17][20] 产品设计 - **人形坚持**:保留小拇指(延长以增强功能性)、设定雌雄同体外貌以降低威胁感、严格按人体比例设计(28个自由度vs人体200+)[5][8][16] - **机械手突破**:第二代手部11个自由度(目标22个),采用绳驱结构模仿肌肉组织,6个压力传感器(vs人手数万个触觉神经)[11][12] - **腿部优化**:线性执行器提供半吨拉力但平衡算法难度大,目前仅能缓慢行走且无法完成下蹲动作 [12][14] 技术挑战 - **感知系统**:移植FSD视觉神经网络至3D环境,但机器人需主动接触物体且缺乏触觉/温度感知 [12][17] - **训练瓶颈**:行业缺乏Scaling Laws,数据不足且模型架构不成熟,通过动作捕捉装置采集人类运动数据 [17] - **量产障碍**:关键部件(如六维力传感器)笨重昂贵,中国供应商样品未达性能要求,计划建立海外供应链 [20][21] 商业逻辑 - **规模效应**:瞄准全球59万台工业机器人市场(2023年数据),目标百万台级量产以降低成本至2万美元 [7][8] - **应用场景**:优先替代汽车工厂总装环节工人(时薪22美元),当前仅2台用于搬运电池(成本效益远低于AGV小车)[8][21] - **供应链准备**:复用电动车供应商(拓普、三花智控等),测试空心杯电机、谐波减速器等部件,中国供应商价格比海外低30%-80% [21] 行业对比 - **波士顿动力Atlas**:专注预设动作(如后空翻),放弃人手与自主决策能力,未解决通用性问题 [5][9] - **传统工业机器人**:2023年销量59万台(相当于劳力士产量),形态碎片化导致规模效应缺失 [7] - **竞品路线差异**:多数公司采用轮式/模块化工具先行,特斯拉直接挑战全功能人形 [8]