Workflow
VLA(视觉语言动作)
icon
搜索文档
低成本机械臂一直复现不出pi0,该怎么办?
具身智能之心· 2026-01-13 08:54
行业痛点与市场需求 - 复现视觉语言动作模型任务面临高成本障碍,市面“能用”的机械臂价格基本在1.5万元以上,加上相机等传感器,对自学者或缺乏设备的群体构成硬伤[3] - 开源低成本机械臂虽可用,但初学者在数据采集、模型训练和动作输出方面普遍遇到困难,难以调出理想效果,大量时间被浪费在“踩坑”上[4][5] - 打通从数据、VLA模型、训练优化到部署的完整任务链对初学者非常困难,特别是对于π0、π0.5、GR00T等前沿模型,其数据采集和训练过程存在诸多技术窍门[5] - 市场存在对低成本完成各类VLA任务的强烈需求,许多学习者希望在预算有限的情况下也能入门该领域[7] 解决方案与课程产品 - 具身智能之心平台基于SO-100机械臂和LeRobot框架,成功复现了ACT、GR00T、π0、π0.5等方法,旨在解决学习者缺乏真机、真机昂贵以及不知如何上手的问题[8] - 平台联合业内VLA专家开发了国内首个《面向实战与求职的VLA小班课》,旨在帮助学习者有效学习快速更新的VLA技术路线,解决即使拥有真机也不知如何使用的困境[9] - 课程内容全面,涵盖机械臂硬件、数据采集、VLA算法、VLA评测、仿真、主流VLA模型部署、VLA+世界模型、各类真机实验以及具身产业讲解等[14] - 该课程被描述为目前平台最大、最完整的课程,采用软硬结合的方式,旨在助力更高效的学习[15] - 课程已于近期正式开课,学习社群内交流活跃,为学员提供问题解答支持[16] 课程硬件与讲师配置 - 购买课程的学员将获赠一套SO-100机械臂,包含示教臂和执行臂,通过淘宝购买后直接发货给学员[18] - 课程讲师为某机器人公司VLA高级研究员,拥有超过5年的机器人行业实战经验,专注于产学研协同落地[21] - 讲师熟练掌握具身智能全栈技术,覆盖数据采集、模型训练与验证、工程化落地等环节,并积累了对人形/轮式机器人、机械臂等多种本体的深度实操经验[21] - 讲师在自动控制、机器人领域的IEEE Trans系列、Neural Networks等顶级期刊上发表过10篇以上学术论文[21] 目标学员与课程要求 - 课程面向正在具身领域求职、需要实战项目和经验的同学;VLA领域的入门及进阶学习者;从事具身智能研究的本科生、硕士生和博士生;希望从传统计算机视觉、机器人或自动驾驶领域转行进入具身智能的人员;以及对具身智能领域感兴趣的其他人员[25] - 课程对计算资源提出建议:推理建议使用RTX 3060及以上显卡;训练建议使用2张以上RTX 3090 Ti显卡;学员也可自行租赁云服务器资源[25] - 学员需具备一定的Python和PyTorch基础[25] 学员收获与课程安排 - 完成课程后,学员预期能够掌握真机的调试与数据采集技能,掌握各类VLA算法在真机上的部署,并对VLA模型的量化有深入了解[25] - 学员将对具身智能产业及其落地应用有清晰的认识,简历上能积累足够多的项目支撑,学完后达到具备1-2年以上经验的算法工程师水平[27] - 课程项目经验可直接写入简历,课程中学到的技术窍门可作为面试答案,从而为学员节省大量自行摸索和“踩坑”的时间[12] - 课程计划从2025年12月30日开课,分九章进行,最后一章课程安排在2026年2月25日[28] - 课程价格为788元[29]
为什么π系列对行业产生了这么大的影响?
具身智能之心· 2025-12-28 11:42
π系列VLA模型的技术演进与行业影响 - π系列是视觉语言动作模型领域的里程碑,以持续技术突破引领生成式AI时代的机器人学习范式,重塑行业应用逻辑 [2] - π0于2024年10月发布,首创Flow Matching连续动作轨迹预测,突破传统离散动作精度瓶颈,为精密制造、自动驾驶等场景提供毫米级操作基础 [3] - π0.5于2025年4月发布,通过异构任务协同训练与层次化推理,在陌生环境复杂任务泛化成功率高达94%,利用人类视频训练使数据成本降低90%,大幅提升跨本体适应性并降低机器人规模化部署门槛 [3] - π0.6于2025年11月发布,通过RECAP强化学习赋能零样本泛化与高效微调,在真实世界效率与精度超越人类,实现工业级100%任务完成率与数十分钟快速换型,推动柔性生产落地 [3] - 其模型能力引领通用机器人从实验室走向工业制造、家庭服务等实景应用,成为2025年来业界众多VLA模型的核心参考 [3] - 不少公司基于π系列搭建真机演示,如叠衣服、拆箱子等,或基于此思路改进优化,其新工作发布常引起行业反响 [3] VLA模型学习与应用的实践挑战 - 基于π系列完成数据、模型训练优化、部署一整套任务对初学者非常困难,有用户甚至踩坑半年无法真正入门 [5] - π系列模型存在“不听话”、不好调试、难以达到预期效果的问题,导致用户花费相当多时间在“踩坑”上 [4] - 对于更新快速的技术路线,如何有效学习VLA难倒了相当多同学,许多人即使拥有真机也不知如何使用 [8] 具身智能之心的VLA实战课程解决方案 - 具身智能之心基于SO-100机械臂复现了π0、π0.5、ACT、GR00T等方法,旨在解决用户缺乏真机和项目指导的问题 [7] - 该平台联合业内VLA专家开发了国内首个《面向实战与求职的VLA小班课》,手把手带领学员复现π0系列 [8] - 课程内容全面,涵盖机械臂硬件、数据采集、VLA算法、VLA评测、仿真、主流VLA模型部署、VLA+世界模型、各类真机实验及具身产业讲解 [13] - 购买课程的学员将获赠一套SO-100机械臂,包含示教臂和执行臂 [17] - 课程讲师为某机器人公司VLA高级研究员,拥有5年以上机器人行业实战经验,聚焦产学研协同落地,并在顶级期刊发表学术论文10余篇 [20] - 课程面向人群广泛,包括正在具身领域求职、需要实战项目的同学,VLA领域入门进阶者,从事具身智能研究的各阶段学生,以及希望从传统领域转行进入具身的从业者等 [25] - 课程要求学员具备一定的Python和PyTorch基础,推理建议使用3060及以上显卡,训练建议使用2张以上3090ti显卡或可自租云服务器资源 [25] - 学员学后有望掌握真机调试与数据采集、各类VLA算法在真机上部署、对VLA模型量化有深入了解,并对具身产业落地有清晰认识,简历上可获得足够多的项目支撑,达到1-2年以上算法工程师经验 [25] - 课程于2025年12月30日正式开课,有效期2年,购买后不支持退款,提供微信VIP群内答疑 [26]
四维图新程鹏:18亿并购,期待拿到高阶辅助驾驶订单
新京报· 2025-10-19 15:02
公司战略与投资 - 公司通过2.5亿元现金增资与15.5亿元资产注入的方式 成为鉴智机器人第一大股东 交易总额达18亿元 旨在构建"新鉴智"平台[1] - 此次交易成为A股市场第一大智驾并购案例 主要目的是抓住AI浪潮 提升公司在高级辅助驾驶 高级智能座舱及AI芯片等产品的AI能力[1] - 公司采取"三箭齐发"策略 同步发展低 中 高阶辅助驾驶产品 目前相关研发团队规模已达七八百人 并将与鉴智机器人团队融合[1] 订单与市场目标 - 公司目前拥有约500万台的定点订单 以中阶辅助驾驶产品为主[2] - 公司期待在未来一年半到两年内获得高阶辅助驾驶的定点订单 目标为再拿到百万台以上的高阶辅助驾驶订单[2] 技术发展与行业展望 - L3级别高级别辅助驾驶发展的主要制约因素是安全与用户信心 法规和保险等方面仍存在问题[3] - 展望未来3-5年 行业可能出现无方向盘和无刹车的量产车 预计5年内不会大规模量产 但将在物流和无人送货等场景实现[3] - 技术浪潮持续迭代 如电池和AI大模型 行业虽进入收敛阶段但仍有发展机会[3] 高精地图业务模式 - 高精地图未来形态将发生变化 从为车辆规划轨道转向依靠实时感知决策 即"无图"模式 新模型可实现实时决策(VLA)[4] - 高精地图有多种付费模式 包括按车收费 按月收费或地图免费而调试等服务收费 在中国市场 地图与芯片 硬件打包销售更为合适[4] 高精地图更新与挑战 - 城市NOA对高精地图的广度 更新频率和成本控制提出更高要求 是推动"无图"技术的原因之一[5] - 通过车路协同 让量产车成为地图采集车 将车辆传感器数据同步给企业以修正地图 是保证高精地图准确性的关键 依赖于足够多的带传感器车辆和数据量[5]
Q2净利润达11亿元!理想汽车首曝自研智驾芯片进展 李想再谈舆情防御、新车计划
每日经济新闻· 2025-08-29 09:58
财务表现 - 第二季度总营收302亿元人民币,同比下降4.5%,环比增长16.7% [1][2] - 车辆销售收入289亿元人民币,同比下降4.7%,环比增长17.0% [2][4] - 毛利率20.1%,同比上升0.6个百分点,环比下降0.4个百分点 [2][4] - 经营利润8.27亿元人民币,同比增长76.7%,环比增长204.4% [2][4] - 净利润11亿元人民币,环比增长69.6% [2][5] - 经营活动所用现金净额-303.62亿元人民币,同比增长607.1% [2] - 自由现金流-384.18亿元人民币,同比增长107.4% [2] - 现金储备1069亿元人民币 [3] 交付与销量 - 第二季度交付量111,074辆,同比增长2.3% [1][6] - 第三季度交付量指引9万至9.5万辆,同比下降41.1%至37.8% [6] - 第三季度营收指引248亿至262亿元人民币,同比下降42.1%至38.8% [6] 产品与技术 - 计划加速技术平台和产品迭代速度以应对竞争 [1] - 9月推出理想i6车型以扩充产品阵容 [3][8] - 自研智驾芯片已完成流片和回片,正在进行车载测试,预计明年部署于旗舰车型 [7] - 自研芯片在运行大语言模型时性能为市场最强芯片的两倍,运行视觉模型时性能为三倍 [7] - 增程全系AD Max车型9月起升级VLA智能辅助驾驶系统 [7] - 2025年研发投入计划110亿至120亿元人民币,其中AI投入超过60亿元 [5] 业务战略 - 营销端强调区域化策略,北方聚焦增程车型,南方侧重纯电车型 [10] - 销服体系调整为总部直管23个区域,实施因地制宜策略 [10] - 渠道端优化一二三线城市门店组合,加快四五线城市覆盖采用轻量化繁星店模式 [11] - 纯电产品理想MEGA月销稳定在3000辆以上,理想i8力争9月底累计交付8000至10000辆 [8] - 第三季度汽车毛利率预计保持在19%左右,现金流状况预计显著改善 [6]
Q2净利润达11亿元!理想汽车首曝自研智驾芯片进展,李想再谈舆情防御、新车计划
每日经济新闻· 2025-08-29 09:57
核心观点 - 公司承认技术迭代速度落后于同行 计划加速产品和技术平台更新以提升竞争力 [1] - 公司第二季度财务表现呈现营收同比下滑但环比改善 盈利能力显著增强 [2][5] - 公司第三季度交付量和营收指引大幅下滑 但预计保持较高毛利率和现金流改善 [8] - 公司通过自研智驾芯片、VLA智能驾驶技术升级和纯电产品矩阵扩张推动长期发展 [9][10] - 公司实施区域化营销策略和渠道优化以应对市场压力并提升销量 [12] 财务表现 - 第二季度交付量111,074辆 同比增长2.3% [1] - 第二季度总营收302亿元 同比下降4.5%但环比增长16.7% [1][2] - 车辆销售收入289亿元 同比下降4.7%但环比增长17.0% [2] - 整体毛利率20.1% 同比提升0.6个百分点 车辆毛利率19.4% 同比提升0.7个百分点 [2][5] - 经营利润8.27亿元 同比增长76.7% 环比增长204.4% [2][5] - 净利润11亿元 环比增长69.6% [2][6] - 研发费用28.1亿元 环比增加3亿元 [6] - 现金储备1069亿元 [4] 技术发展 - 自研智驾芯片已完成流片 正在进行车载测试 预计明年部署旗舰车型 [9] - 自研芯片在运行大语言模型时性能达市场最强芯片两倍 视觉模型达三倍 [9] - 9月起增程全系AD Max车型将升级VLA智能辅助驾驶技术 [9] - 2025年研发投入计划110-120亿元 其中AI投入超60亿元 [6] 产品规划 - 计划9月推出理想i6车型 作为纯电走量主力 [4][10] - 理想MEGA月销稳定在3,000辆以上 [10] - 理想i8目标9月底累计交付8,000-10,000辆 [10] 运营策略 - 营销端强调区域化策略:北方聚焦增程车型 南方侧重纯电车型 [12] - 销服体系调整为"总部直管23个区域" 实施因地制宜策略 [12] - 优化一二三线城市门店组合 加快四五线城市"繁星店"轻量化覆盖 [12] - 采用新传播方式强化产品价值沟通 加强直营体系服务优势 [11] 业绩展望 - 第三季度交付量指引9-9.5万辆 同比下降41.1%-37.8% [8] - 第三季度营收指引248-262亿元 同比下降42.1%-38.8% [8] - 预计第三季度汽车毛利率保持在19%左右 [8] - 预计第三季度现金流显著改善 第四季度销量恢复将强化现金流 [8]