Workflow
VLA算法
icon
搜索文档
VLA+RL方案的部署落地如何啦?
具身智能之心· 2025-12-01 11:12
直播活动概览 - 具身智能之心公众号举办线上直播活动,主题为“VLA与RL的真机部署 如何更好落地” [5] - 直播时间为12月6日19:30,可通过扫描二维码免费观看 [16] - 活动将围绕VLA算法与RL落地问题展开讨论 [3] 核心讨论议题 - VLA的架构和模型现存痛点分析 [8] - 提升机器人全身运动控制方案性能的进化空间探讨 [8] - VLA+RL技术如何更有效地部署到真实机器人硬件,包括硬件选型和轻量化实现方案 [8] 分享嘉宾阵容 - 隋伟:地瓜机器人算法副总裁 [9] - 张强:北京人形机器人首席研究员、学术委员会主任 [11] - 汪天才:原力灵机合伙人 [11] - 于超:清华大学博士,即将加入清华深研院任助理教授,担任主持人 [13] - Gloria:具身智能之心联创 [15] - 刘斯坦:知乎大V,全网拥有13万关注者的专业自媒体,深度流光CTO [15] 后续内容获取 - 直播完整版深度内容已独家上线知识星球「具身智能之心」,涵盖所有技术细节、QA及未公开彩蛋 [19] - 知识星球内容包含灵巧手设计与难题分析、Agent概念探讨、Spec-VLA推理加速框架、CMU跨实体世界模型等深度解析 [19]
VLA+RL方案:具身的“关键突破”,如何更好地部署落地?
具身智能之心· 2025-11-29 10:07
直播活动概览 - 活动主题为VLA与RL的真机部署及如何更好落地 [5] - 直播时间定于12月6日19:30 [16] - 活动形式为线上直播 [5] 分享嘉宾阵容 - 隋伟担任地瓜机器人算法副总裁 [9] - 张强为北京人形机器人首席研究员及学术委员会主任 [11] - 汪天才担任原力灵机合伙人 [11] - 于超为清华大学博士并将加入清华深研院任助理教授 [13] - 主持人包括Gloria(具身智能之心联创)和刘斯坦(知乎大V、深度流光CTO) [15] 核心讨论议题 - VLA的架构和模型现存痛点分析 [8] - 提升机器人全身运动控制方案的进化空间探讨 [8] - VLA+RL上真机的实践方法、硬件选型及轻量化解决方案 [8] 过往活动与深度内容 - 具身智能之心已举办多场高质量圆桌讨论涉及本体、数据、仿真等方向 [3] - 知识星球提供完整版深度内容涵盖技术细节、QA及未公开彩蛋 [19] - 深度解析主题包括灵巧手设计、Agent技术、Spec-VLA推理加速框架及跨实体世界模型等 [19]
下周六具身一场深度直播:VLA与RL的落地之问!
自动驾驶之心· 2025-11-28 08:49
直播核心主题 - 探讨视觉语言动作模型算法与强化学习落地问题 [2][3][6] 讨论议题 - 视觉语言动作模型架构和模型存在的痛点 [6] - 提升机器人全身运动控制性能的方案进化空间 [6][15] - 视觉语言动作模型结合强化学习实际上机的策略、硬件选择及轻量化方法 [6][15] 参与嘉宾 - 隋伟 地瓜机器人算法副总裁 [9] - 张妮 北京人形机器人首席研究员、学术委员会主任 [11] - 汪天才 原力灵机合伙人 [13] - 于超 清华大学博士 即将加入清华深研院任助理教授 担任主持 [15]
VLA+RL方案:具身的“关键突破”,如何更好地部署落地?
具身智能之心· 2025-11-27 12:00
直播活动概览 - 活动主题为VLA与RL的真机部署及如何更好落地 [5] - 直播时间为12月6日19:30 [17] - 活动形式为线上直播,可通过扫描二维码免费观看 [17] 核心讨论议题 - 探讨VLA的架构和模型现存痛点 [8] - 分析让机器人"舞得更好"的全身运控方案进化空间 [8] - 讨论VLA+RL如何更好上真机、如何挑选"板子"及轻量化实现方案 [8] 分享嘉宾阵容 - 隋伟担任地瓜机器人算法副总裁 [9] - 张强为北京人形机器人首席研究员、学术委员会主任 [11] - 汪天才担任原力灵机合伙人 [11] - 于超为清华大学博士,即将加入清华深研院任助理教授 [13] - 主持人包括Gloria(具身智能之心联创)和刘斯坦(知乎大V、全网13万关注者、《PyTorch自动驾驶视觉感知算法实战》作者、深度流光CTO) [15] 深度内容获取渠道 - 完整版深度内容已独家上线知识星球「具身智能之心」 [20] - 知识星球内容涵盖所有技术细节、QA及未公开彩蛋 [20] - 深度解析主题包括灵巧手的设计与难题、Agent在思想学术与工程领域的真义、Spec-VLA推测解码框架、CMU跨实体世界模型等 [20]
7000+人围观!具身智能赛道迎来硬核玩家,史河机器人技术直播全景揭秘
机器人大讲堂· 2025-08-22 12:27
具身智能行业趋势 - 具身智能正成为推动机器人从可执行向高效卓越发展的关键力量[1] - 多模态大模型持续突破为机器人与执行的结合带来新历史机遇[19] - VLA类算法整合视觉、语言与动作指令,使机器人能更准确理解人类意图并执行复杂操作[19] 行业技术瓶颈 - 硬件平台适配性不足,通用机器人难以满足多模态数据采集精细化需求[1] - 算法复现成本高企,异构数据处理复杂度与模型训练周期形成双重压力[1] - 感知-决策-执行链路断裂,传感器、机械结构与算法难以协同[1] EA200硬件创新 - 基于移动底盘与双臂协同领域多年技术积淀开发[7] - 躯干系统采用俯仰结构结合升降系统,搭载高性能差速底盘,灵活适应多样化工作场景[7] - 头部配备高清相机与六麦克风阵列,结合激光雷达、IMU等传感器构建多维感知输入矩阵[9] - 6自由度手臂系统具备高负载能力,支持复杂双臂协同操作任务[9] - 整机移动能力依托结构紧凑的移动底盘,配合两轮差速驱动及多传感器融合技术[11] 软件与算力架构 - 集成ROS2导航系统并融合自研算法,支持从环境建图到自主导航的全流程应用[11] - 配套提供外置推理工控机及专业级/消费级训练服务器,兼顾实时运行与大规模训练算力需求[13] - 实现从多模态数据采集到嵌入式推理部署的全链路协同,单日可采集500+条双臂动作轨迹样本[13] 产品定位与价值 - 明确聚焦机器人科研与教学应用,面向高校、科研院所及企业研发部门[16] - 通过统一动作空间设计将末端执行器位姿、关节速度等参数标准化,破解异构数据联合训练难题[16] - 可模拟室内桌面、实验室等多种真实环境,结合数据增广功能为算法泛化验证提供支持[16] - 贯通从算法原型探索至最终工程落地的全流程,显著压缩算法设计-实验验证周期长度[13][18] 企业战略布局 - 从传统设备供应商向一体化解决方案提供者转型,构建完整技术体系[21] - 通过软硬件深度融合、算法与实体系统协同互促的建设思路切入具身智能领域[4][21] - 拥有实际产品载体EA200,表明进军具身智能领域的步伐正在加速[6]
“伯克利四子”罕见同台,我们整理了WAIC最豪华具身论坛
36氪· 2025-08-04 12:52
论坛背景与参与者 - 2025年世界人工智能大会期间上海期智研究院举办人工智能交叉科学论坛 聚焦具身智能领域[1] - 论坛聚集具身智能领域"伯克利四子":星动纪元创始人陈建宇 千寻智能联合创始人高阳 星海图联合创始人许华哲 蚂蚁集团强化学习实验室首席科学家吴翼[1] - 四位学者均担任上海期智研究院首席研究员 该研究院由图灵奖得主姚期智于2020年创立并担任院长[2] 具身智能发展三阶段 - 第一阶段:机器人进入生产力系统 生产手机汽车等产品 贡献超过目前一半GDP[5] - 第二阶段:机器人成为最大终端 具备自我制造能力[6] - 第三阶段:机器人帮助人类拓展能力边界 如火星移民 最终布满整个宇宙[7] 数据获取瓶颈与解决方案 - 具身智能训练数据需求达10^9小时级别 远超遥操作采集的1万小时数据量[11] - 数据金字塔分为三层:塔尖为遥操作数据 中间层为人类第一视角数据(通过VR/智能眼镜采集) 底层为互联网视频数据(YouTube视频总时长约10^11小时)[11] - 仿真数据存在局限性 无法生成智能体行为数据 只能提供被动物理交互数据[11] - 人形机器人设计(如星动L7高1.7米)可更好收集人类多样性数据 规模化将推动成本下降[12] 模型构建与算法创新 - 当前VLA模型存在纯克隆问题 缺乏举一反三能力且难以超越人类表现[12] - 需结合世界模型(形成物理世界认知)和强化学习(模仿学习+自我训练调整)[12][13] - 提出PID模型和Video Addiction Policy 融合VLM理解与世界模型生成能力 利用互联网视频数据提升泛化性[13][14] - 千寻智能提出TactileVLA概念 在视觉基础上加入触觉模态 提升拿取物体和擦黑板等任务的判断准确性[16][17] - 开发OneTwoVLA模型 结合System1(直觉快速)和System2(系统慢速)思考模式 实现任务层级分解[18][19] 智能体架构与多智能体协作 - 具身智能体需具备三种能力:规划 记忆调整 使用工具[24] - 采用Function Call机制 通过逻辑推理 代码编写 代码执行完成物理任务[24] - 实现Multi-Agent系统 多个机器狗可组成足球队进行竞争合作 人机之间也可实现交互[26] - 蚂蚁集团推出AReaL开源框架 支持智能体开发[28] 数据质量与规模化挑战 - 具身智能在小规模数据下依赖背诵 缺乏泛化能力[31] - 当前人类数据和仿真数据存在与现实世界冲突问题 难以学习本质规律[31] - 提出具身智能数据Scaling坐标:横轴Path Sampling(同一场景不同动作路径) 纵轴World Sampling(不同场景相同任务)[34] - 建议先沿单一轴突破 再拓展另一轴 避免同时推进导致数据需求过大[34]
3天搞定机械臂上的VLA完整部署:算法&项目实践
具身智能之心· 2025-07-01 20:07
具身智能与机械臂行业趋势 - 2025年政府工作报告首次将"具身智能"写入政策文件 显示该领域已成为国家战略方向[1] - 机械臂作为具身智能落地的核心载体 在工业 医疗 服务等领域应用广泛[1] 行业技术痛点 - 算法从仿真环境部署到硬件存在两大核心障碍:工程实践能力不足 以及 对机械臂操作与抓取方法掌握不系统[2] - 当前VLA算法在机械臂上的部署效果不佳 阻碍了具身智能的实际场景应用[2] 产学研合作项目 - 深蓝学院联合华为天才少年秦通与松灵机器人推出具身智能线下实训营 聚焦机械臂操作与抓取技术[3] - 课程提供真实机械臂实操机会 覆盖运动规划 视觉反馈 模仿学习 VLA等关键技术[5] - 实训项目包括RViz模型与真机1:1映射 以及机器视觉引导的自适应抓取等实战内容[5] 课程技术亮点 - 实现全栈技术闭环 涵盖算法到硬件的工程化能力培养[16] - 采用松灵硬件平台支撑沉浸式项目实操 每组配备1-2条机械臂[9][16] - 结合产学研资源 由VINS作者秦通等顶尖学者提供技术指导[7][16] 目标受众 - 机器人与自动化专业在校学生[18] - 机械臂和具身智能领域研发工程师[18] - 工业自动化与智能制造工程师[18]