Robotics

搜索文档
浙大具身智能VLN+VLA统一框架:ODYSSEY
具身智能之心· 2025-08-25 08:04
ODYSSEY框架核心创新 - 提出分层视觉-语言规划器 将基于自我中心感知的长期指令分解为可执行动作 弥合自我中心感知与语言任务间差距 [4] - 设计首个适用于复杂地形的四足机器人全身控制策略 协调运动和操作 实现从模拟到现实的有效迁移 [4] - 构建首个长期移动操作基准测试 覆盖广泛现实世界室内外场景 提供语义推理/任务规划/导航/操作能力全面测试平台 [4] - 实现模拟到现实迁移 现实部署展现强大泛化能力和鲁棒性 验证非结构化环境部署可行性 [4] 研究背景与动机 - 移动操作在动态非结构化环境中至关重要 需结合移动性/操作/实时感知实现复杂任务如微妙调整位置抓取物体 [5] - 现有研究局限:大型语言模型多局限于桌面场景 未解决移动平台感知受限和执行器范围有限问题 [5] - 开放世界环境中操作策略泛化能力不足 非结构化环境中高平台机动性与精确末端执行器控制的双重需求研究不足 [5] - 研究动机为解决上述局限 提出统一移动操作框架实现四足机器人开放世界长期任务执行 [5] 技术架构设计 - 全身控制策略定义为单一网络 将观测向量映射到目标动作 观测包括运动指令/末端执行器目标/局部地面高度图/重力向量等 [9] - 输出动作为默认关节配置偏移量 通过PD控制器转换为扭矩 [9] - 全局规划器融合RGB和LiDAR流构建空-语义表示 利用预训练基础模型映射实例图 [10] - GPT-4.1分解自然语言指令为原子动作 输出粗略目标航路点 投影到2D占用图生成无碰撞目标姿态 [10] - Qwen2.5-VL-72B-Instruct根据RGB观测推断任务相关接触点 投影到深度图像恢复3D位置 根据几何约束确定末端执行器朝向 [10] 训练方法 - 采用两阶段训练:第一阶段固定机械臂关节训练静态负载运动 引入步态奖励和频率奖励改善探索效率 [11] - 第二阶段控制所有18个关节 扩展奖励函数包括末端执行器跟踪项 采用地形不变采样策略提高交互精度 [11] - 全程运用领域随机化增强不同负载适应性 [11] 基准测试构建 - 资产库包含50个刚体物体/15个容器/30个关节结构/10个可拖动物体 [20] - 10个真实场景涵盖室内家居/超市/餐厅/室外庭院等 [20] - 从物体布局/物理属性/环境条件/地形复杂性四维度引入变化确保泛化能力 [20] - 多阶段任务套件包括短期操作技能和长期移动操作任务 长期任务由2-3个子目标组成 共246个室内和58个室外变化 [20] - 模块化评估协议同时评估整体任务成功率和每个动作成功率 [20] 性能评估结果 - 短期任务评估显示在所有数据集实现显著改进 仅依赖单个自我中心摄像头下优于PerAct的精细操作能力 [17] - 在未见数据集上性能保持稳定 PerAct性能急剧下降 表明具备处理未见物体配置的泛化能力 [17] - 长期任务评估涵盖8个移动操作任务 整体成功率均达40%以上 原子技能成功率保持60%以上 [19][29] - 导航成功率表现优异:室内导航成功率97.4%-98.4% 室外导航成功率95.6% [19] - 抓取成功率72.7%-85.0% 放置成功率76.5%-96.8% 推/拉操作成功率71.0%-94.1% [19] 模拟到现实迁移 - 使用Unitree Go2四足机器人和Arx5机械臂构建平台 配备MID-360 LiDAR定位和D435i/D405 RealSense相机 [36] - 现实世界测试两个长期任务("导航到抓取"和"抓取和放置") 使用五种不同物体 [36] - 成功实现任务规划和执行从模拟到现实的迁移 [37] - 存在模拟到现实差距:抓取小物体时因末端执行器跟踪和视觉感知不准确导致失败 [37] 未来发展方向 - 将基准测试扩展为全面评估范式 评估视觉-语言模型和移动操作器的跨体现语义推理和运动-操作协调能力 [38] - 探索主动感知新兴能力 使动态场景理解和自适应运动协同作用 实现更有效现实世界交互 [38] - 解决杂乱非结构化环境中新行为 进一步弥合高层规划和低层控制间差距 [38]
Prediction: These 2 Trillion-Dollar Artificial Intelligence (AI) Stocks Could Strike a Megadeal That Wall Street Isn't Ready For
The Motley Fool· 2025-08-25 02:00
核心观点 - 苹果和特斯拉作为科技巨头在人工智能领域存在明显短板 均未建立规模化AI业务 但通过战略合作可互补优势 加速下一代AI应用商业化 [2][4][19] 苹果现状分析 - 公司依赖iPhone渐进式升级 AI领域进展缓慢 缺乏独立AI平台 [3] - 取消造车项目Project Titan 研发数年未推出正式产品 错失汽车市场机会 [6] - Vision Pro头显被定位为高端奢侈品而非大众市场突破性产品 消费者采用率有限 [7] - 持有超过1320亿美元现金及等价物 拥有全球分销渠道优势 [15] 特斯拉现状分析 - 人形机器人Optimus和机器人出租车网络具备变革潜力 但尚未实现规模化验证 [3] - 缩减内部Dojo AI超算项目 转向英伟达和AMD基础设施 凸显自建系统成本高昂 [14] - 尽管资产负债表健康 但近年资本配置决策存在争议 [12] 合作潜在价值 - 苹果可借助特斯拉自动驾驶系统和机器人技术 整合自身AI软件生态及营销能力 [9] - 特斯拉可利用苹果资金加速Optimus和机器人出租车商业化 避免财务过度扩张 [15] - 苹果品牌影响力有助于特斯拉AI驱动设备从原型概念转化为主流产品 [16] - 战略合作比直接收购更能释放增值机会 避免重复过去昂贵错误 [10][17]
任正非:中国在技术研究领域的发展步伐不可阻挡
观察者网· 2025-08-24 17:59
任正非回顾了年轻时在西安市的经历以及与西安交大的渊源,赞扬了交通大学的西迁壮举,肯定了西安交大为西部发展和中国高等教育事业作出的贡献。 他强调了以数学为代表的基础研究的重要性,指出大学的核心使命是探索0到1的原始创新,并表示华为公司通过开放全球产业需求、设立专项竞赛等机 制,积极与高校开展协同创新。他坚信,中国在技术研究领域的发展步伐不可阻挡。 据微信公众号"西安交大深圳校友会"消息,8月18日,西安交通大学党委书记卢建军,校长、中国工程院院士张立群带队赴深圳市华为技术有限公司总部 (以下简称"华为")、优艾智合机器人科技有限公司(以下简称"优艾智合")推进合作,并与深圳校友代表交流。中国科学院院士、西安交大教授何雅 玲,党委常委、常务副校长别朝红参加有关活动。 华为公司创始人兼首席执行官任正非在总部会见卢建军、张立群一行,双方围绕科研、教育、人才等进行了座谈。华为公司常务董事、EMT(经营管理 团队)经营联席会议主任汪涛,董事、2012实验室总裁查钧,2012实验室副总裁、人力资源管理部副总裁田兴普,战略研究院院长周红,西安研究所所长 寇文、技术合作部部长付洁等参加。 在优艾智合调研期间,公司创始人兼首席执 ...
佛企斩获1万台订单,具身智能商业化按下“快进键”
21世纪经济报道· 2025-08-23 21:25
行业订单与规模突破 - 广东天太机器人联合多家企业签署具身智能人形机器人1万台订单 刷新全球单笔订单纪录 [2] - 2024年中国人形机器人商用销售出货量仅约两千台 与万台订单形成巨大反差 [2] - 行业预测2024年中国人形机器人市场规模达27.6亿元 2035年有望突破3000亿元 [2] 应用场景与需求驱动 - 订单机器人首要聚焦家庭康养赛道 融合医疗辅助、教育陪伴与数字生活功能 [3] - 中国60岁及以上人口达3.1亿 占总人口22% 护理人力缺口扩大养老机器人需求 [4] - 家庭环境相对结构化且容错率高 技术适配性优于工业场景 [4] 技术突破与成本控制 - 机器人硬件成本占比70% 核心部件包括关节、电机、减速机及结构件 [7] - 订单机器人采用轮式移动方案 高度1.2米 侧重性价比与应用可行性 [7] - 天太机器人新一代关节模组单价进入三位数区间 实现从高价定制向平价量产转变 [8] 量产规划与产能部署 - 2025年完成首代产品原型开发 2026年实现5万台量产并扩大产能 [5] - 2026年底至少交付1万台面向家庭康养的具身人形机器人 [5] 政策支持与产业合作 - 政府工作报告首次提出培育具身智能产业 大力发展智能机器人装备 [3] - 工信部与民政部推动智能养老服务机器人应用试点 覆盖家庭、社区和养老机构场景 [3] - 合作方山东未来机器人具国资背景 隶属山东未来集团体系 形成民企技术与国资资源联动 [9]
Physical Intelligence 核心技术团队分享:物理世界的“Vibe Coding”如何实现?
海外独角兽· 2025-08-23 20:04
技术演进路径 - VLA是VLM在机器人领域的应用 能够接收图像和文本输入并整合机器人状态信息 直接输出控制机器人的动作指令 与文本生成模型存在本质差异[6][12] - VLM在LLM基础上拓展视觉感知能力 能处理纯文本输入和涉及视觉内容的复杂信息 训练流程已较完善[7] - VLA发展路径与VLM类似但起步稍晚 2024年下半年出现Gemini for Robotics等方案 仍属概念验证阶段[16] 机器人智能发展维度 - 能力指完成从未实现的复杂任务 π₀演示多步骤操作能力 执行偏差时主动调整 接近人类灵活应对能力[23] - 泛化指在陌生环境中正确执行任务 训练覆盖家庭环境越多 新环境表现越好 数据多样性是提升泛化关键路径[23][44] - 性能需提升任务成功率 稳定性 速度和鲁棒性 当前模型处于演示就绪而非部署就绪阶段 失败仍频繁[24][25] 数据管线构建 - 团队从头搭建数据引擎 超过一半工作集中在数据系统构建 收集和质量保障 六个月收集约1万小时机器人操作片段[30][37] - 数据涵盖数十个不同家庭环境和数百类任务 包括折叠衬衫 物品搬运和整理 更贴近真实生活场景[37] - 移动操控系统采集数据提升多样性 涵盖数百种不同场景 捕捉动态变化环境 任务复杂度从简单抓取扩展到细致操作[41][42] 算法架构创新 - 提出知识绝缘机制重构训练流程 将连续动作序列离散化为text-like tokens 截断梯度回传保护主干网络 训练速度提升10倍[47] - π₀.₅架构以pre-training的Transformer为核心 拓展Action Expert Transformer子模块 实现语义到物理执行高效衔接[50] - 采用软硬件解耦战略 将智能软件作为系统核心 降低对特定机器人硬件依赖 提升模型部署灵活性与效率[53] 开放世界部署挑战 - 数据缺口体现在数量和质量 机器人操作需物理交互闭环反馈时序数据 收集真实有效交互数据门槛高成本昂贵[54] - 性能不稳健是最大挑战 动作指令需高频率低延迟 需应对物理扰动和感知不确定性 存在时序错位问题[54][56] - 硬件平台迁移复杂 不同机器人在控制协议 感知系统和执行机制差异巨大 缺乏统一接口层[58] 未来发展方向 - 重点突破性能瓶颈 研发通用任务配方 构建覆盖多场景多任务的标准化评估体系 通过统一benchmark量化模型性能[60] - 构建通用可定制机器人智能生态 用户通过自然语言发布命令引导机器人完成复杂操作 降低使用门槛[61] - 推动软硬件深度融合 用户可设计定制硬件并注入智能算法 实现物理世界的vibe coding 可能催生机器人模型即服务新模式[61][62]
都市评:广州博览会变未来体验舱,新质生产力要从民间破圈
南方都市报· 2025-08-23 13:49
展会定位与转型 - 第三十三届广州博览会以培育新质生产力为核心目标 实现五个首次突破 包括首次设立新质生产力主题展区和机器人表演专区 [2] - 展会从传统贸易展转型为新质生产力超级接口 连接全球技术与广州智造 聚焦民生需求应用 [4] - 展会覆盖新质生产力多场景应用 包括智能制造 低空飞行 医疗健康等领域 实现技术研发到政策配套的闭环 [2][4] 技术展示与产业应用 - 广汽 亿航等企业展示低空飞行器技术 体现智能制造业发展实力 [2] - 情绪机器人和AI中医等民生科技实现落地应用 包括陪聊服务和把脉诊断功能 [2] - 机器人表演专区实现人形机器人与观众互动 显示人工智能技术在生活场景的渗透 [2][4] 产业生态与国际化 - 与国际发明展联动 展示2000多项中外发明技术 强化技术交流与创新合作 [2] - 数字湾产业政策大模型DBayGPT发布 体现人工智能在政策制定领域的应用突破 [2] - 广州推动12218现代化产业体系转型 重点发展智能网联汽车 载人飞行器和养老机器人等产业 [4]
东莞市雷探智通科技有限公司成立 注册资本100万人民币
搜狐财经· 2025-08-23 13:19
公司基本信息 - 东莞市雷探智通科技有限公司于近日成立 [1] - 公司注册资本为100万人民币 [1] - 经营范围涵盖智能机器人研发、制造及销售 [1] - 业务包括工业机器人制造与销售 [1] - 涉及特殊作业机器人制造领域 [1] 技术研发与制造能力 - 公司开展智能机器人研发业务 [1] - 具备工业机器人制造能力 [1] - 从事特殊作业机器人制造 [1] - 开展人工智能理论与算法软件开发 [1] - 涉及集成电路设计与销售业务 [1] - 开展智能控制系统集成服务 [1] - 从事物联网技术服务与设备制造 [1] - 开展轨道交通运营管理系统开发 [1] 产品与业务范围 - 经营智能机器人销售业务 [1] - 提供智能基础制造装备销售 [1] - 从事安防设备制造业务 [1] - 开展雷达及配套设备制造 [1] - 提供物料搬运装备销售 [1] - 从事计算机软硬件及外围设备制造 [1] - 开展智能家庭消费设备制造 [1] - 涉及智能车载设备制造业务 [1] - 提供机械电气设备销售服务 [1] 技术服务与支持 - 提供软件开发服务 [1] - 开展信息系统集成服务 [1] - 提供电子、机械设备维护服务 [1] - 开展机械设备租赁业务 [1] - 提供信息技术咨询服务 [1] - 开展技术服务、技术开发、技术咨询等业务 [1]
全球三大机器人展:德国慕尼黑机器人展(automatica)中国工博会机器人展(RS)日本东京机器人展(iREX)
机器人大讲堂· 2025-08-23 12:07
中国工博会机器人展概况 - 中国国际工业博览会自1999年创办,是获国际展览业协会认证的大型展会,兼具展示、交易、论坛和评奖功能[2] - 2025年机器人展主题为"具身工业 智领未来",展示规模达56000平方米,汇聚全球超350家知名企业,于9月23日-27日在上海国家会展中心举办[4][12] 全球三大机器人盛会对比 - 慕尼黑automatica展:2025年6月举办,汇集40个国家近800家参展企业(含170家中国企业),吸引49300名专业观众,国际观众占比38%[7] - 东京iREX展:2025年12月举办,2023年已吸引654家展商和148125名观众,2025年规模预计创新高,聚焦节能减排型机器人和远程控制技术[23][24] - 中国工博会机器人展:成为全球规模最大、参展企业最多、应用场景最丰富的机器人全产业链盛会,国际影响力显著提升[11][24] 展会核心特色 - 全产业链覆盖:展品涵盖工业机器人、协作机器人、人形机器人、机器视觉、核心零部件、移动物流解决方案六大板块[13] - 国际化程度高:参展企业来自德国、日本、美国等十多个国家和地区,外资品牌参展面积超40%[12] - 企业质量优异:包括136家专精特新企业、51家小巨人企业、7家独角兽企业、17家制造业单项冠军、4家技术创新示范企业、95家创新型中小企业和33家瞪羚企业[12] 技术发展重点 - 聚焦具身工业:通过赋予机器人类人类的感知、决策和执行能力突破传统工业边界,代表性产品包括新松多可机器人、埃斯顿Codroid 02人形机器人、节卡Lumi具身智能平台[13] - AI驱动创新:展会以"AI+机器人:解锁多元场景新机遇"为主题举办高峰论坛,探讨行业趋势[14] - 应用场景丰富:设置汽车制造柔性焊接工作站、生物医药无菌操作机器人、物流智能仓储分拣系统等垂直领域展区[14] 行业地位与影响 - 成为连接全球机器人技术与中国市场的核心枢纽,展示中国智能制造转型路径[19] - 从"展中展"发展为国际顶尖平台,定义机器人产业发展的"中国路径",为全球机器人科技进步注入中国动能[24] - 汇聚机器人全产业链企业,包括工业机器人领域的ABB、发那科、库卡、安川电机四大家族,以及服务机器人、医疗机器人、人形机器人、核心零部件等细分领域领军企业[12][33][35][36][37][38][39]
为软体机器人穿上“铠甲”!受虾类启发,中国团队造出刚柔并济的机械外骨骼
机器人大讲堂· 2025-08-23 12:07
核心观点 - 中国军事科学院国防科技创新研究院团队开发出一种仿生折纸外骨骼 显著提升软体机器人的刚度和负载能力 同时保持其柔性和变形能力 该技术通过多稳态折纸结构实现刚柔并济 在无人地面车辆和无人机平台演示中展现出强大应用潜力 [3][4][18] 折纸外骨骼设计理念 - 从虾蛄等生物外骨骼的刚性-柔性耦合设计获得灵感 采用梯形几何面板和铰链连接的非对称结构实现双稳态行为 [3][4][5] - 结构在面内方向具有高拉伸/压缩刚度 面外方向通过弯曲铰链实现低弯曲刚度 允许大变形 [7] - 多模块串联可实现216种稳定构型 提供丰富形态适应性且无需持续能量输入维持状态 [9] 机械性能验证 - 单个模块自重30克 可承受6.24kg轴向压力 承载重量比达208:1 弯曲状态下负载能力2.03kg [12] - 集成层板扭转接头后弯曲负载能力提升23% [12] - 外骨骼以非侵入式包覆软体执行器 抗压能力从23.1N提升至80.0N [14] 实际应用演示 - 在UGV平台部署600毫米机械臂 成功在复杂地形导航并在700毫米高度抓取运送物体 [15] - 在JT-10无人机平台部署1.7米机械臂 总重4.15公斤 完成精准穿刺和重物搬运任务 [16] - 机械臂连续执行拉开抽屉取物动作 无人机姿态偏差控制在±6°以内 [16][17] 技术优势 - 解决软体机器人刚度-变形矛盾 提供工程可行方案 降低控制复杂性和能耗要求 [18] - 通过可主动变形的机械超结构实现刚柔并济能力 触发形态改变仅需低能量输入 [18]
Trend-setting Tech Feast! 33rd Guangzhou Fair Meets International Invention Exhibition
21世纪经济报道· 2025-08-23 09:56
展会规模与参与情况 - 第33届广交会于8月22日在广交会展馆开幕 展会为期三天 [1] - 展会面积约18万平方米 较上届规模增长超过50% [1] - 吸引超过3200家商协会和企业作为采购商参与 [1] 展会主题与展示重点 - 本届展会突出新质生产力发展 聚焦人工智能与机器人、智能网联与新能源汽车、低空经济与航天等新兴产业 [2] - 首次设立广州新质生产力展区 展示尖端智能制造技术和创新产品 [2] - 首次设置机器人表演区 汇集超过130台机器人进行互动动态展示 [2] 同期活动与国际化参与 - 第11届国际发明展暨一带一路暨金砖国家技能发展与技术创新大赛同期举办 [3] - 吸引来自30多个国家和国际组织的超过300名嘉宾参与 [3] - 展示来自中国及全球的超过2000项发明成果 [3]