通用飞行智能
搜索文档
微分智飞高飞:我们正处于通用飞行智能爆发前夜丨GAIR 2025
雷峰网· 2025-12-19 12:55
文章核心观点 - 智能飞行机器人是具身智能的重要分支,通用飞行智能已到爆发前夜,旨在打造聪明、安全、能自主决策的飞行平台[7] - 行业正致力于攻克天空端具身智能的独特挑战,以构建技术护城河,并最终实现能大规模量产的智能飞行机器人[16][22] - 通过构建从“小脑”到“群脑”的五维技术体系,公司展示了在环境感知、本体控制、端侧决策、集群协同及飞行操作方面的显著进展,推动技术在多场景落地[18][45] 飞行机器人的愿景和无人机技术演进 - 旋翼无人机技术从2015年前依赖人工操控的“高级玩具”,演进至具备跟踪避障、自主导航等机器人学赋能阶段,下一个里程碑是“具身智能”[9] - 团队的终极愿景是打造如电影《普罗米修斯》中所示的、能在复杂环境中自主穿梭的智能飞行器,以及如《流浪地球》反例所强调的、无需中心节点的分布式无人机集群[10] - 目标是开发具备规模化、分布式化和高灵活特性的智能飞行载体,以执行大规模复杂任务[10] 天空端具身智能的四大挑战 - **数据稀缺**:无人机难以通过雇佣专业飞手进行高精度飞行控制来采集数据,因技能门槛高、设备易损毁且存在安全风险,导致数据采集成本与风险不可控[12] - **场景复杂**:无人机飞行场景跨度大、环境差异显著,要求算法具备跨场景泛化能力,核心难点在于从差异化场景中提炼通用化的环境表征规律[14] - **易受干扰与零容错**:无人机易受气流扰动,需具备极强动态抗扰能力,且飞行过程零容错,任何剐蹭都可能导致坠毁,无停驻待机机会[14] - **端侧资源受限**:机载算力弱、传感器性能有限,难以支持大模型在端侧实时运行,且易受各种扰动[15] 技术体系与研发进展:从“小脑”到“群脑” - **小脑技能(本体运控)**:通过sim-to-real端到端强化学习技术,使无人机仅凭单颗机载摄像头,即可将视觉图像映射为控制指令,端侧模型运行频率超过100Hz,实现高动态自适应飞行[25] - **小脑技能(性能表现)**:系统飞行能力可超越人类高水平飞手,能自主连续穿越多个狭窄不规则缝隙,并完成如倒转穿框等高难度特技动作[27] - **小脑技能(轻量化与仿真)**:最小端到端网络可部署在总重仅50克的无人机上,实现低成本端到端导航避障,并构建了像素级、以假乱真的数字孪生仿真系统用于数据合成[29] - **大脑(端侧决策与规划)**:研发的路径规划大脑具备跨本体(旋翼/固定翼无人机、轮足机器人)和跨场景的通用能力,单次神经网络路径规划时间在10毫秒以内[30] - **大脑(多模态理解)**:通过端/边缘侧部署的视觉语言基础模型,飞行机器人能理解语言文字指令,将模糊逻辑与视觉图像对齐,完成从理解、推理到决策的闭环,实现无GPS、无人为操作的自主探索任务[31][33] - **集群协同智能**:致力于打造完全分布式、去中心化的无人机集群架构,确保个体加入或退出不影响整体任务,已实现16架无人机在未知、无GPS环境下的实时协同与队形保持[35][37][38] - **集群协同规模**:分布式集群避障算法框架在仿真中已支持1,000架以上无人机规模,是学界考虑高阶动力学的实时分布式最大规模运动规划算法框架[37] - **集群应用(协同作业)**:实现多机协同三维重建与任务调度,并成功演示多机协同调运,通过精细化动力学模型实时分配拉力,确保载荷稳定及无个体“偷懒”,相关研究已被TRO条件接收[39][40] - **飞行操作一体化**:开发了具备“飞行手”功能的欠驱动机械手无人机,可通过单电机实现指尖捏取或掌心抓握,完成“抓了就跑”的物品投递任务,并能在抓取前后保持平稳飞行[42][43][45] 产业应用与商业化方向 - 技术正朝多个方向落地,包括泛测绘-巡检(替代人工进入复杂恶劣环境)、特种安防、车用级飞行智能体(满足移动平台协同需求)以及通用开放的二次开发平台[45]