VLA任务 - 财报，业绩电话会，研报，新闻

VLA任务

搜索文档

具身智能之心· 2026-01-24 09:05

行业趋势：具身智能与VLA任务硬件成本快速下降 - 用于VLA任务的机械臂价格在过去两年内急剧下降，从2年前的单价30,000元以上，降至1年前的15,000元左右，目前进一步降至5,000元以下 [1][2] - 低成本机械臂（如5,000元以下产品）的出现，使得实现π0、π0.5等各类VLA任务的门槛显著降低 [2] 市场痛点：初学者进入VLA领域面临多重障碍 - 尽管硬件成本下降，但初学者在复现VLA任务时仍面临“成本太高”的挑战，开源低成本机械臂存在调试困难的问题 [3] - 打通数据采集、VLA模型、训练优化与部署的全流程对初学者而言非常困难，其中涉及许多“trick”，导致大量时间浪费在“踩坑”上 [4][6] - 即使拥有真机硬件，许多学习者仍因技术更新快、缺乏有效指导而不知如何上手使用 [9] 解决方案：推出面向实战的VLA系统课程 - 有平台基于SO-100机械臂和LeRobot框架，复现了ACT、GR00T、π0、π0.5等主流VLA方法，旨在解决缺乏真机、真机昂贵及上手困难的问题 [8] - 该平台联合业内专家开发了国内首个《面向实战与求职的VLA小班课》，课程内容全面，涵盖机械臂硬件、数据采集、VLA算法、模型评测与部署、仿真、真机实验及产业讲解等 [9][14] - 课程被描述为目前该平台最大、最完整的课程，采用软硬结合的方式，旨在帮助学习者更有效地掌握VLA技术 [15] 课程价值主张：提升技能与求职竞争力 - 课程项目经验可直接写入简历，掌握的“trick”可作为面试答案，核心价值在于为学习者节省大量自行摸索和“踩坑”的时间 [12] - 课程面向多类人群，包括具身领域求职者、VLA入门进阶者、相关专业学生以及希望从传统CV、机器人等领域转行的人员 [26] - 完成课程后，学习者预期能对具身产业有清晰认识，简历上获得足够项目支撑，并达到具备1-2年以上经验的算法工程师水平 [32] 课程配套与讲师资质 - 购买课程的学员将获赠一套SO-100机械臂（包含示教臂和执行臂），硬件直接发货给学员 [19] - 课程讲师为某机器人公司VLA高级研究员，拥有5年以上机器人行业实战经验，精通具身智能全栈技术，并在顶级期刊发表学术论文10余篇 [22] 课程实施细节 - 课程已正式开课，采用录播形式，购买后2年内支持反复观看，并提供VIP群答疑服务 [17][27] - 课程对学员的硬件配置提出建议：推理建议使用RTX 3060及以上显卡，训练建议使用2张以上RTX 3090 Ti显卡，也可自租云服务器资源 [26] - 学员需具备一定的Python和PyTorch基础 [26]

用低成本复现这几个Git上最受欢迎的VLA任务

具身智能之心· 2026-01-11 11:02

行业痛点与市场需求 - 复现视觉语言动作模型任务面临高成本障碍，可用的机械臂基本价格在1.5万元以上，加上相机等传感器，对自学者或缺乏设备的群体构成硬伤 [3] - 开源低成本机械臂存在使用门槛，初学者在数据采集、模型训练和动作生成方面难以调出效果，导致大量时间浪费在踩坑上 [4][5] - 打通数据采集、VLA模型、训练优化与部署的全流程任务对初学者非常困难，特别是对于π0、π0.5、GR00T等模型，其数据采集和训练存在许多技巧 [5] - 市场存在对低成本完成各类VLA任务的强烈需求，许多学习者希望在预算有限的情况下也能入门该领域 [7] 解决方案与课程产品 - 具身智能之心平台基于SO-100和LeRobot复现了ACT、GR00T、π0、π0.5等方法，旨在解决学习者缺乏真机、真机昂贵以及不知如何上手的问题 [8] - 平台联合业内VLA专家开发了国内首个《面向实战与求职的VLA小班课》，以应对技术更新快、学习难度大的挑战 [9] - 课程内容全面，涵盖机械臂硬件、数据采集、VLA算法、模型评测、仿真、主流VLA模型部署、VLA结合世界模型、各类真机实验以及具身产业讲解 [14] - 该课程被描述为平台最大、最完整的课程，采用软硬结合的方式，旨在提升学习效率 [15] - 课程已正式开课，学员社群内交流活跃，能够为学习过程中遇到的问题提供解答 [16] 课程硬件与师资 - 购买课程的学员将获赠一套SO-100机械臂，包含示教臂和执行臂，通过淘宝购买后直接发货给学员 [18] - 课程讲师为某机器人公司VLA高级研究员，拥有超过5年的机器人行业实战经验，聚焦产学研协同落地，熟练掌握具身智能全栈技术 [21] - 讲师在人形/轮式机器人、机械臂等多种具身本体上有深度实操经验，并在自动控制、机器人领域的IEEE Trans系列、Neural Networks等顶级期刊发表过10篇以上学术论文 [21] 目标人群与课程要求 - 课程面向正在具身领域求职需要实战项目的同学、VLA领域需要进阶的入门者、从事具身智能研究的本硕博学生、希望从传统CV/机器人/自动驾驶转行至具身领域的人员，以及对具身智能感兴趣的其他人员 [25] - 课程对计算资源有明确建议：推理建议使用RTX 3060及以上显卡，训练建议使用2张以上RTX 3090 Ti显卡，学员也可自行租赁云服务器资源 [25] - 学员需要具备一定的Python和PyTorch基础 [25] 学习收获与课程安排 - 完成课程后，学员将掌握真机的调试与数据采集、各类VLA算法在真机上的部署，并对VLA模型的量化有深入了解 [25] - 学员将对具身产业和落地应用有清晰认识，简历上能积累足够多的项目支撑，学完后能达到具备1-2年以上经验的算法工程师水平 [27] - 课程项目经验可直接写入简历，所学技巧可作为面试答案，能帮助学员节省大量自行摸索踩坑的时间 [12] - 课程计划于2025年12月30日开课，后续章节将持续至2026年2月25日 [28] - 课程价格为788元 [29]

开发者福利！一台机器搞定人形运控、强化学习、VLN/VLA

具身智能之心· 2025-07-25 15:11

产品概述 - TRON1是一款专为教育科研设计的一体化研究平台，支持验证人形运动控制、强化学习、VLN任务、VLA任务等多种功能[1] - 采用双足、双点足和双轮足"三合一"模块化设计，可快速切换、自由组合，一机支持多形态算法研发[1] - 一套产品可同步验证点足运动控制、双足人形运动控制和轮式运动控制，实现"买一得三"[1] 版本与功能 - 提供基础版本和EDU版本，EDU版本支持二次开发和外设加装[4] - 标准版不配置RGBD相机，EDU版配有RGBD相机并提供SDK和内置接口供二次开发[24] - 支持外设加装机械臂、深度相机、激光雷达等组件，扩展感知、操作和语音交互功能[6][11][13][18] 技术参数硬件配置 - 感知拓展套件配备NVIDIA Ampere架构GPU，157 TOPS稀疏算力，16GB LPDDR5内存，256GB固态存储[16] - 语音交互套件搭载Jetson Orin NX模组，支持360°拾音，最大拾音距离4m，支持普通话和英语[19] - 机械参数：尺寸≤392mm x 420mm x 845mm，净重≤20kg，材质为铝合金+工程塑料[26] - 电气参数：48V供电，240Wh电池，续航≥2小时，支持快速换电[26] 性能指标 - 运动速度：点足/双足<1m/s，轮足最高速度≥5m/s[26] - 负载能力：约10kg（极限15kg），最大爬坡角度≥15°，最大落差高度15cm[26] - 关节参数：额定扭矩30Nm，峰值扭矩80Nm，峰值转速15rad/s[28] 开发支持 - 支持C++和Python两种开发语言，提供完善的SDK和开发文档[6][33] - 兼容NVIDIA Isaac、Mujoco、Gazebo等主流仿真平台，Sim2Real差距小[9] - 提供数据可视化工具、关节控制函数、仿真平台等开发者工具[28] - 配套丰富的使用教程，涵盖开箱、遥控、拓展开发、校准等全流程[29][37] 应用场景 - 仿人形步态开发、强化学习论证[6] - 移动操作任务（如VLA），支持"单臂+双足"或"单臂+轮足"模式[11] - 三维建图、重定位、导航及动态避障等感知任务[13] - 语音交互开发，适用于教育科普、导览解说等场景[18] - 复杂地形运动、移动操作+机械臂等测试场景[20][21]

真香！一台机器搞定人形运控、强化学习、VLN/VLA

具身智能之心· 2025-07-18 10:28

产品概述 - TRON1是一款专为教育科研设计的一体化研究平台，支持验证人形运动控制、强化学习、VLN任务、VLA任务等多种功能 [1] - 采用双足、双点足和双轮足"三合一"模块化设计，可快速切换、自由组合，一机支持多形态算法研发 [1] - 一套产品可同步验证点足运动控制、双足人形运动控制、轮式运动控制，实现"买一得三" [1] 功能特点 - 定义为仿人形步态开发平台，支持人形运控研究和强化学习论证 [6] - EDU版本可外设深度相机或RGB相机，支持目标导航和感知功能开发 [6] - 支持外设加装机械臂，实现VLA功能验证（导航+抓取） [6] - 开发语言支持C++和Python，降低使用门槛 [6] 技术参数硬件配置 - 感知拓展套件包含NVIDIA Ampere架构GPU（1024 CUDA核心，157 TOPS稀疏算力）、8核Arm CPU（2.0GHz）、16GB LPDDR5内存 [16] - 激光雷达参数：水平FOV 360°，点云输出200000点/秒，深度相机分辨率1280x720 [16] - 语音交互套件支持普通话/英语，拾音距离≤4m，可自定义唤醒词和大模型部署 [19] - 标准版和EDU版均采用48V三元锂电池（240Wh），续航≥2小时，充电时间<1小时（20%-80%） [26] 性能指标 - 运动速度：双足/双点足<1m/s，双轮足最高≥5m/s [26] - 负载能力：约10kg（极限15kg），最大爬坡角度≥15°，最大落差高度15cm [26] - 关节参数：额定扭矩30Nm，峰值扭矩80Nm，峰值转速15rad/s [29] 应用场景 - 支持复杂地形运动、移动操作+机械臂任务 [20] - 感知模块可用于三维建图、重定位、导航及动态避障 [13][21] - 语音交互模块适用于具身智能教育、导览解说、展会互动等场景 [18][22] 开发支持 - 提供完整URDF模型，支持NVIDIA Isaac、Mujoco、Gazebo等主流仿真平台 [9] - SDK支持数据可视化、记录回放、关节控制函数等功能 [29][34] - 配套开发指南和用户手册，提供1年免费售后服务 [40][37] 产品版本 - 分为基础版本和EDU版本，后者支持外设加装感知、语音交互组件及GPU算力资源 [4] - EDU版额外提供IMU数据获取、USB3.0/GbE拓展接口、24V外设供电（峰值200W） [29]