强化学习 - 财报，业绩电话会，研报，新闻

强化学习

搜索文档

具身智能之心· 2025-06-30 20:17

研究背景与动机 - 无人机从遥控平台发展为自主智能体系统，受AI特别是认知架构推动[6] - Agentic AI的出现标志着无人机设计根本性转变，使其具备自主性、目标导向和情境感知能力[6] - 农业、物流、环境监测等领域对无人机自主性需求日益增长，操作环境日趋动态化[6] 核心定义与架构 - Agentic UAVs定义为具有认知能力、情境适应性和目标导向行为的新型自主空中系统[11] - 核心架构包含感知层（多模态传感器）、认知层（推理与规划）、控制层（飞行执行）、通信层（交互协同）[12] - 相比传统无人机，Agentic UAVs在自主性水平（Level 4-5）、决策架构（RL-based）和系统集成方面有显著差异[9] 关键技术推动因素 - 边缘AI模块（NVIDIA Jetson等）支持实时深度学习推理[14] - 多模态传感器融合（RGB/热成像/LiDAR）实现环境联合观测[14] - 视觉-语言模型（VLMs）使无人机能理解执行自然语言指令[14] 主要应用领域精准农业 - 作物健康监测：通过NDVI/EVI指数动态调整飞行路径[17] - 精准喷洒：AI驱动目标识别优化滴液大小与路径[17] - 自主播种：地形分析动态调整轨迹适应复杂田地[17] 灾难响应 - 幸存者检测：热成像+运动跟踪生成概率热图[21] - 群体协调：V2V通信实现去中心化覆盖与冗余[21] - 野火监测：多光谱相机动态跟踪火势蔓延[21] 城市基础设施检查 - 桥梁检查：SLAM+深度学习缺陷分类生成3D语义地图[27] - 道路监测：卷积网络检测坑洼裂缝[27] - 自动报告：结构化输出符合工程标准[27] 物流配送 - 最后一公里配送：多模态感知实现GPS拒止环境导航[28] - 自适应投放：实例分割识别合适着陆点[31] - 群体协调：V2V通信优化能耗与任务分配[31] 技术挑战 - 电池寿命：机载AI推理使飞行时间降至20-45分钟[45] - 传感器集成：多模态感知增加重量与功耗[45] - 实时导航：GPS拒止环境下VIO/SLAM易受环境噪声影响[47] 未来发展方向 - VTOL平台结合旋翼机敏捷性与固定翼耐力[55] - 联邦学习实现跨异构环境模型共享[58] - 数字孪生技术支持预测性维护与场景测试[70]

具身智能领域，全球Top50国/华人图谱（含具身智能赛道“师徒关系图”）

Robot猎场备忘录· 2025-06-30 16:09

具身智能技术发展 - 具身智能赛道涉及大语言模型(LLM)、视觉多模态模型(VLM)、强化学习(Reinforcement Learning)、深度强化学习(Deep Reinforcement Learning)、模仿学习(Imitation Learning)等前沿技术 [1] - 人形机器人算法从早期模型控制算法(LIPM+ZMP)演进到动态模型控制(MPC+WBC)，当前主流为模拟+强化学习(IL+RL)，但MPC仍被部分公司采用 [1] - IL+RL技术主要由高校和头部科技大厂研发，导致人形机器人初创公司以"学院派"教授团队为主 [1] 顶尖研究机构与人才分布 - UC Berkeley在AI+Robotics领域排名第一，斯坦福大学次之 [2] - UC Berkeley"归国四子"吴翼、高阳、许华哲、陈建宇均经历"清华大学-UC Berkeley-清华交叉信息研究院-创业"路径，其中三人师从Vision领域权威Trevor Darrell教授并加入BAIR实验室 [2] - 斯坦福大学代表学者王鹤(师从Leonidas J Guibas)现任北大助理教授并创立银河通用，卢策吾(师从李飞飞和Leonidas Guibas)任上海交大教授并创立非夕科技和穹彻智能 [3] 全球Top50华人背景特征 - 具身智能领域Top50华人普遍拥有UC Berkeley、斯坦福、MIT、CMU等顶尖院校求学经历并师从行业权威 [4] - 全球Top50华人图谱涵盖高校教授、科技大厂核心成员及初创企业创始人，详细记录其求学院校、导师、研究方向、论文成果及职业履历 [3][5] 研究机构专项 - UC Berkeley(加州大学伯克利分校)作为具身智能领域核心院校被单独列出 [6]