pi0.5
搜索文档
一直霸榜的pi0.5,被中国的模型干下来了!!!
具身智能之心· 2026-01-12 08:03
模型性能突破 - 千寻智能团队研发的Spirit v1.5模型在RoboChallenge评测榜上超越此前霸榜的Pi0.5,以66.09的总分和50.33%的成功率夺得总榜第一,而Pi0.5的分数和成功率分别为61.84和42.67% [2][4] - 这是中国具身智能模型首次在性能上超越海外最先进的开源模型,标志着中国在该领域进入全球领先阶段 [2] 传统数据方法的局限性 - 依赖高度“干净”的演示数据是模仿学习的弊病,其对应高昂成本,且存在多样性低和可扩展性受限的问题 [5] - 数据多样性低:采集过程遵循固定指令,导致数据缺乏多样性,例如“擦桌子”的数据集无法让模型学习处理打滑、杂乱表面或光线变化等现实复杂性 [5] - 可扩展性受限:每个新任务都需要精细的设计和质量控制,消耗大量工程资源,限制了数据采集的体量和模型可获得的机器人经验 [5] Spirit v1.5的核心技术特点 - 模型训练不依赖高度精选的“干净”演示数据,避免了因数据过于理想化而限制机器人在开放世界中的泛化能力 [6][7] - 在预训练阶段引入了开放式、多样化的数据采集范式,数据采集以“完成有意义目标”为导向,允许操作中自然串联多个子任务,使模型能接触到遮挡、失败恢复等真实世界复杂性 [8] - 这种基于多样化数据的预训练范式,代表了机器人学习领域摆脱对高度精选数据集依赖的根本性转变 [14] 多样化数据的训练优势 - 消融实验表明,在相同数据规模下,基于多样化数据预训练的模型在新任务上的迁移效率明显高于基于传统演示数据训练的模型,达到相同性能所需的计算资源显著减少 [9] - 多样化数据预训练的模型比干净数据训练的模型具有更快的收敛速度和更好的验证误差 [12] - 模型迁移效率随多样化数据量的增加呈正相关,数据规模扩大能持续降低模型在新任务上的验证误差,表明任务多样性比单任务演示数量更为关键 [13][16] - 使用高多样性、弱控制的数据进行预训练不仅可行,而且显著优于学术界常见的利用“干净”数据的做法 [13]
从零将π0.5部署到具身机械臂上!
具身智能之心· 2025-11-20 08:03
产品发布与定位 - 公司宣布支持pi0.5部署,相关代码将正式开源,旨在加速具身智能科研落地 [1][2] - Imeta-Y1是一款面向具身智能领域打造的轻量级高性价比机械臂,专为新手、学生、教育工作者及机器人领域初学者设计,旨在解决硬件选择中价格过高或低价产品难用、难上手的问题 [3] - 该产品定位为帮助用户低成本、高效率地完成算法验证与项目开发 [3] 核心产品优势 - 提供全流程开源工具链与代码示例,覆盖从数据采集到模型部署的全过程,对新手友好 [4][20] - 支持Python与C++双语言接口,兼容ROS1与ROS2,并提供URDF模型,实现仿真与真机的无缝切换 [4][21][22] - 提供24小时快速售后响应,确保学习与开发过程顺畅 [4][22] - 产品融合高精度运动控制、低功耗设计与开放软硬件架构,支持从仿真到真机的无缝联调 [6] - 紧凑型结构与模块化接口使其特别适用于嵌入式AI与机器人学习平台的开发 [7] - 支持视觉、力控等多模态数据融合,兼容TensorFlow、PyTorch等主流框架,实现端到端的智能算法落地 [20][39] - 后期将陆续升级更新VLA、VA相关源码,新老客户均可享受升级 [22] 机械臂硬件规格 - 本体重量为4.2千克,额定负载为3千克,具有6个自由度 [9][22][23] - 工作半径为612.5毫米,重复定位精度为±0.1毫米 [9][22][23] - 供电电压为24V,控制器为PC,材质为铝合金(部分规格包含树脂) [9][22] - 通讯方式为CAN,控制方式支持轨迹跟踪、示教及API [9][22] - 各关节运动范围与最大速度均有详细规格,例如J1关节运动范围为-165°至165°,最大速度为180°/秒 [9][23] 仿真与开发支持 - 提供URDF模型,支持Gazebo等主流仿真环境与真机实时联动,用户可在仿真中验证算法并一键部署至物理设备,降低开发风险与调试成本 [20][25] - 提供完整的开源软件开发工具包(SDK),包含驱动程序、API接口、示例代码与文档,支持Python、C++等语言 [32][33] - 目前已开源适配的算法包括lerobot和ACT,robotwin、pi0等将逐步适配并开源给用户 [53] 售后服务与交付 - 产品交付周期为1至2周 [51] - 提供半年质保(非人为损坏),质保期后售后费用按市场价计算 [52] - 批量采购享有更多优惠,并支持基于本产品的项目开发与教学培训 [22]
字节跳动一机器人团队研究员因泄密被开除
南方都市报· 2025-11-12 16:24
事件概述 - 字节跳动Seed研究员任某某因泄露公司机密被开除 [2] - 该员工深度参与了公司机器人操作大模型GR-3的研发工作 [2] 涉事技术详情 - GR-3模型于2024年7月发布,是一款具身智能视觉语言动作模型 [2] - 该模型能通过极少量人类轨迹数据进行高效微调,实现对新场景快速低成本的适应 [2] - 据该员工评估,现有具身智能模型的智能水平约相当于人类1-2岁,在观察理解世界及进行精细复杂操作方面仍有很大技术空缺 [2] 公司内部管理 - 字节跳动Seed团队成立于2023年,研究方向涵盖大语言模型、语音、视觉、世界模型、基础架构、AI Infra及下一代AI交互 [2] - 字节跳动在2024年第二季度辞退100名员工,其中10名员工因违规参与外部付费访谈、违反信息安全制度而受到处罚 [3] - 公司提醒员工拒绝外部咨询公司以专家访谈等名义发起的有偿邀约,以保护公司保密信息 [3] 行业背景 - 互联网公司因泄密开除员工的现象并不鲜见,例如原小米集团中国区市场部总经理王腾于2024年9月因泄露公司机密信息被开除 [3] - 涉事员工在加入字节跳动前,曾在协作机器人公司珞石科技担任系统工程师,后于小米机器人实验室从事机械臂相关工作 [3]