具身智能之心
搜索文档
26年首个!这家明星创业公司开始冲刺IPO
具身智能之心· 2026-01-23 17:35
公司动态与里程碑 - 星海图于2024年1月23日完成股份制改造,并更名为“星海图(北京)人工智能科技股份有限公司”,成为具身智能赛道今年首个完成此动作的公司 [1] - 公司股改被视为准备后续上市工作的明确信号,此前宇树、智元等同行也在股改后启动了上市准备 [2] 公司融资与估值 - 公司成立于2023年9月,创立至今已累计完成七轮融资 [2] - 投资方阵容强大,涵盖蚂蚁集团、美团、BV百度风投、联想创投、高瓴创投、IDG资本等头部机构,全面覆盖战略投资、产业资本与财务投资 [2] - 公司当前估值已达百亿元规模 [2] 公司业务与技术布局 - 公司聚焦于“一脑多形”具身智能机器人领域,实现了从具身本体、端到端AI算法到场景解决方案的全栈自研 [4] - 公司已构建起“本体+平台+模型+数据”的完整业务布局 [4] - 产品端拥有通用仿人形机器人R1 Pro、轮式双臂移动平台R1 Lite等核心产品 [4] - 模型端已迭代推出G0 Plus VLA模型,其开放的数据集下载量已超过50万次 [4] 商业化进展 - 公司已成功获得国内头部汽车制造商与物流企业的千台级订单 [4] - 业务场景广泛覆盖制造、物流等多个核心领域 [4]
一份全球人形机器人销量榜单,让这家具身巨头紧急发声......
具身智能之心· 2026-01-23 09:43
文章核心观点 - 根据Omdia报告,2025年全球人形机器人出货量预计达13,318台,中国企业占据主导地位,出货量全球占比超过80% [1] - 行业头部公司智元机器人(AGIBOT)在报告中以5,168台出货量位列榜首,但宇树科技官方澄清其2025年实际出货量已超5,500台,高于报告数据 [1][4][7] - 报告数据与公司官方声明存在显著差异,凸显了行业销售数据的敏感性与不透明性,同时引发了对市场重心从“科研教育”向“真实工业场景”转移的思考 [9] 2025年全球人形机器人出货量报告数据总结 - 2025年全球人形机器人总出货量预计为13,318台,较2024年的2,300台大幅增长 [2] - 出货量达500台及以上的四家公司均为中国企业:智元机器人(5,168台)、宇树科技(4,200台)、优必选(1,000台)、乐聚机器人(500台) [1][2] - 其他主要厂商出货量包括:Engine AI (400台)、Fourier Intelligence (300台)、Figure AI (150台)、Agility Robotics (150台)、特斯拉 (150台) [2] 宇树科技对出货量数据的澄清 - 宇树科技官方声明,其2025年人形机器人实际出货量超过5,500台,该数字指实际出售发货给终端客户的数量,订单数量更高 [4][7] - 公司2025年人形机器人本体量产下线数量超过6,500台 [7] - 澄清数据仅包含纯人形机器人,不包含双臂轮式等其他机器人产品,并建议勿将不同类型机器人的数量直接合并对比 [7] 行业现状与观察 - 机器人公司的销售数据非常敏感,通常不会轻易对外公布,使得券商和研究机构难以获取准确信息 [9] - 与国内公司相比,国外公司如特斯拉和Figure AI在工业产线等真实场景测试上持续努力,进展显得更为“矜持” [9] - 报告数据与实际情况的差异,引发行业思考是否需要从已占据优势的“科研教育市场”转向开拓“真实工业场景” [9]
一款持续在进化的具身机械臂......
具身智能之心· 2026-01-22 17:42
产品定位与核心价值 - 公司推出Imeta-Y1,一款面向具身智能科研领域的轻量级高性价比机械臂,旨在解决该领域硬件选择中“太贵买不起”或“太便宜难用”的痛点 [2] - 产品专为新手、科研初学者、学生、教育工作者及刚入行的开发者设计,旨在帮助用户低成本、高效率地完成算法验证与项目开发 [2] - 公司认为真正的“性价比”不在于静态参数,而在于产品的持续进化能力,并致力于通过开源更新和功能迭代来拓展“轻量级”的边界 [2] 目标用户与核心优势 - 对新手友好,提供全流程开源工具链和代码示例,覆盖从数据采集到模型部署的全过程,帮助新人快速上手不卡壳 [3][17] - 提供快速响应的售后支持,承诺24小时内响应,为学习过程提供保障 [3][19] - 支持批量采购,并提供更多优惠,同时支持基于该产品的项目开发与教学培训 [19] 产品关键性能参数 - 机械臂本体重量为4.2公斤,额定负载为3公斤,拥有6个自由度 [8][19] - 工作半径为612.5毫米,重复定位精度达到±0.1毫米 [8][19] - 供电电压为24V,采用PC作为控制器,材质主要为铝合金 [8][19] - 通讯方式为CAN,控制方式支持轨迹跟踪、示教和API [8][19] - 各关节运动速度最高可达180°/s至220°/s [8][21] 软件开发与兼容性 - 提供完整的开源软件开发工具包(SDK),包含驱动程序、API接口、示例代码与文档 [29][30] - 支持Python和C++双语言开发接口,方便不同编程背景的用户快速上手 [3][18][30] - 兼容ROS1和ROS2机器人操作系统,并提供URDF模型,支持仿真与真机无缝切换 [3][17][19] - 提供从数据采集、模型训练到推理部署的全流程工具链,支持视觉、力控等多模态数据融合 [17][36] - 兼容TensorFlow、PyTorch等主流AI框架,助力实现端到端的智能算法落地 [17][36] 仿真与部署能力 - 提供URDF模型,支持Gazebo等主流仿真环境与真机实时联动,用户可在仿真中验证算法后一键部署至物理设备,降低开发风险与调试成本 [17][22] - 产品已适配Pi0与Pi0.5任务,并能够适配Lerobot框架,同时被赋予VR遥操作能力 [2] - 公司计划后期陆续升级更新VLA(视觉语言动作)、VA(视觉动作)相关的源码,且新老客户均可享受升级 [19] 硬件配置与扩展 - 机械臂采用紧凑型结构与模块化接口,适用于嵌入式AI与机器人学习平台的开发与应用推广 [6] - 产品已适配RealSense D435系列、奥比中光DCW2等型号的相机 [50] - 公司表示所有开源模型用户均可自行微调,并已适配Pi0和Pi0.5模型 [50] - 对于需要运行VLA模型的用户,公司适配的ALOHA ACT算法在NVIDIA GeForce RTX 4060显卡上即可进行训练和推理 [50] 交付与售后政策 - 产品交付周期为1至2周 [48] - 提供半年质保,范围限于非人为损坏,质保期后售后服务需按市场价付费 [49] - 不支持无理由退货或测试,除非产品本身存在问题 [51]
世界模型+强化学习=具身智能性能翻倍!清华&加州伯克利最新开源
具身智能之心· 2026-01-22 09:05
编辑丨 量子位 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 在具身智能 (Embodied AI) 的快速发展中, 样本效率 已成为制约智能体从实验室环境走向复杂开放世界的瓶颈问题。 不同于纯数字域的对话任务, 具身任务 通常涉及极度复杂的物理环境感知以及高维度的连续控制输出,这意味着智能体面临着巨大的状态- 动作搜索空间,导致学习效率低下且难以收敛。 传统的无模型强化学习由于缺乏对底层物理逻辑的理解,完全依赖于海量的盲目试错来获取学习信号。 然而,在现实物理世界中,每一次交互都伴随着不可忽视的时间损耗、高昂的硬件维护成本以及潜在的安全风险,这使得动辄数亿次的交互 需求变得极不现实。 为了应对这一挑战, 世界模型强化学习 (World Model RL) 研究应运而生。 其核心范式在于通过额外学习一个能够表征环境内在转移规律的预测模型,使智能体具备在想象空间中进行自我进化的能力。 这种机制允许智能体在潜空间内进行大规模、低成本的轨迹预演与策略优化,从而显 ...
参与全球首个VLA+RL框架的开发!清华大学团队成员招募了~
具身智能之心· 2026-01-21 12:00
项目概述 - RLinf是全球首个用于具身大模型训练的强化学习基础设施,其最大特色是专注于具身领域的视觉-语言-动作模型与强化学习任务 [1] - 项目未来将持续有其他功能上线 [1] 技术架构与支持 - 项目支持广泛的模拟器,包括ManiSkill、LIBERO、RoboTwin、RoboVerse、BEHAVIOR、MetaWorld、IsaacLab、CALVIN、RoboCasa、Franka-Sim等 [4] - 项目支持真实世界机器人平台,如Franka Arm,并计划扩展更多 [4] - 项目集成了多种模型,包括VLA、OpenVLA、OpenVLA-OFT、GROOT、VLM、Qwen2.5-VL、自定义模型、MLP策略、CNN策略等 [4] - 项目支持多种算法,包括GRPO、PPO、DAPO、Reinforce++、SAC、CrossQ、RLPD、SAC-Flow等强化学习算法,以及全参数微调、LoRA微调等监督微调方法 [4] 人才招募与职业发展 - 项目提供硕士、博士、博士后及研究助理的招募机会,名额来自清华大学电子工程系和清华大学深圳国际研究生院的教授 [5] - 项目可为优秀参与者提供推荐,前往海外、北京大学、北京航空航天大学、上海交通大学、中关村等高校攻读博士或硕士学位 [6] - 对于非学术界参与者,项目可将优秀人才推荐至各公司担任方向负责人、首席架构师等职位,并提供前沿的研发方向与有竞争力的薪酬 [6] - 此外,项目也提供与国家实验室等机构相关的机会 [6] 项目联系与获取 - 项目网站为 https://github.com/RLinf/RLinf [2] - 感兴趣者可联系项目负责人于超老师,需附上个人简历 [7]
最近具身求职的同学越来越多了......
具身智能之心· 2026-01-21 08:33
行业现状与发展历程 - 行业在2022年之前已由少数开拓者开始探索具身机器人的数据、算法和推理,算法和硬件水平持续提升,应用场景逐渐清晰[2] - 机器人本体在稳定性和实用性上持续进步,形态从简单的双足、四足向更精美的人形和移动操作机器人演进,强大的供应链使落地成本不断下降[4] - 数据采集方案从仿真优先向UMI及更拟人的方案演变,行业致力于实现数据的规模化和易用性,不同任务对数据生产方式有不同要求[6] - 相比传统机器人,具身智能领域的算法更偏向人工智能,涵盖视觉语言动作、视觉语言导航、交互大模型、强化学习及世界模型等技术,基于模仿学习和强化学习的方案提升了模型的泛化能力[8] - 行业发展迅速,短短数年已涌现近300家相关企业,众多优秀团队参与并持续改变产业和技术格局[8] 行业面临的系统性挑战 - 行业在高速发展同时,在市场调研、产品设计、数据与成本控制以及盈利模式等方面存在持续性问题[9] - 具身智能是一个系统工程,公司面临市场调研方法、产品定义、系统工程管理、场景化方案选择、研发资源与时间估算以及数据策略等多重战略决策,这些决策直接影响后期利润空间[10] - 完成产品迭代需要硬件系统、软件系统和数据飞轮三大支柱:硬件需设计满足需求的本体,要求团队精通结构、传感与执行系统;软件需选择合适的中间件和算法模块以匹配不同场景的逻辑功能;持续迭代模型依赖于数据反馈,没有好的数据平台就没有未来[10] - 产品的市场定位、定价策略、与竞品的差异化以及商业模式设计,是企业生存必须做好的关键功课[10] - 目前行业内各家公司均在摸索前行,缺乏一套完整的实践指南[11] 市场参与者的核心需求与痛点 - 算法开发人员希望通晓具身智能的上下游产业链、完整开发流程、应用场景与商业化路径,以便在开发时能兼顾目的与成本[12] - 来自传统行业的转型者认为具身智能是朝阳行业,但苦于没有系统的入门教程,自行摸索试错成本高昂[12] - 投资者需要深入了解真实的市场需求、评估创业团队潜力及盈利模式的可靠性,不能只懂投资而不懂产业与技术[12] - 在校学生期望能快速加入具身智能赛道,并希望有导师带领入门[13] 解决方案与市场机会 - 随着行业体系日益完善,目前具备了提供系统性指导的条件[14] - 有机构研发了《面向具身领域的产品经理课程》,旨在为参与者提供完整的行业版图认知,以拥抱更大的市场空间[15] - 该课程适合具身智能方向的在校学生、具身领域的算法与开发等技术人员、来自互联网或传统行业希望转型的人士,以及创业者、企业高管和投资人等多元群体[15][25] - 课程提供一套完整的知识体系,涵盖行业本质、市场分析、产品策划、开发落地、技术理解及职业规划,帮助构建核心认知框架[19] - 课程有助于参与者在行业初期看懂产业链格局,预判技术趋势与商业机会,并提供高质量的交流圈子,可与来自顶尖学府、大厂及明星创业公司的同行共同成长[19] - 课程主讲人拥有QS50强名校背景,曾担任两家世界500强企业机器人板块产品线负责人,具备十年机器人及具身智能领域的产品与研发管理实战经验,并拥有从0到1到100的机器人量产经验[20]
为什么扩散策略在操作任务上表现良好,很难与在线RL结合?
具身智能之心· 2026-01-21 08:33
文章核心观点 - 一篇韩国团队的综述论文首次系统梳理了在线扩散策略强化学习的研究现状,构建了统一的算法分类与基准测试体系,为规模化机器人控制提供了新的理论框架与实践指南 [1] - 该综述通过“算法分类 - 实证分析 - 应用指导”的逻辑,揭示了不同算法的核心权衡,并提出了清晰的技术路线图,旨在推动扩散策略从实验室走向真实世界的规模化应用 [1][30] 问题根源与核心挑战 - **训练目标冲突**:扩散模型的去噪训练目标与在线强化学习的策略优化机制存在本质不兼容,难以直接复用传统强化学习的梯度更新逻辑 [4][5] - **计算与梯度难题**:扩散模型的多步反向去噪过程需通过长链反向传播计算梯度,计算成本极高,且易引发梯度消失或爆炸问题 [5] - **泛化与鲁棒性不足**:离线扩散策略受限于固定数据集,无法自主探索新动作;而在线学习需兼顾环境适应性与跨机器人形态迁移能力,现有方法难以平衡 [5] 四大家族算法体系 - **动作梯度类方法**:通过动作梯度直接优化策略,规避扩散链反向传播的复杂度,代表算法包括DIPO、DDiffPG、QSM,其关键优势为计算效率高,适合资源受限场景 [7][9] - **Q加权类方法**:通过Q值加权调制扩散损失,引导策略向高回报区域收敛,代表算法包括QVPO、DPMD、SDAC,其关键优势是保留扩散模型的多模态表达能力 [7][10] - **近邻类方法**:借鉴PPO等近邻策略优化思路,解决扩散策略对数似然难以计算的问题,代表算法包括GenPO、FPO,其关键优势是在大规模并行环境中性能突出,收敛稳定性强 [7][11] - **时序反向传播类方法**:通过端到端反向传播遍历完整扩散过程,代表算法包括DACER、DACERv2、DIME、CPQL,理论上能充分利用扩散过程的时序信息,但扩展性差,计算成本随扩散步骤增加呈指数增长 [7][12] 五大维度实证分析 - **任务多样性**:在涵盖12个机器人任务的统一基准测试中,GenPO在6/12任务中排名第一,峰值性能突出;DIPO在离线策略中表现最优,平均排名为3.58 [13][15][16] - **并行化能力**:GenPO、PPO等在线策略在1024个并行环境下性能显著提升,但在8个环境的受限场景中性能暴跌95%以上;DIPO等离线策略对并行化规模不敏感,鲁棒性更强 [18][19] - **扩散步骤扩展性**:动作梯度类、Q加权类方法随扩散步数K值增加性能提升;BPTT类方法在K>20后性能急剧下降,梯度不稳定问题凸显 [21] - **跨机器人形态泛化**:测试从源机器人到目标机器人的零样本迁移能力,发现离线策略迁移鲁棒性更强,在线策略在机器人硬件差异较大时易出现稳定性崩溃 [23][25] - **分布外环境鲁棒性**:评估在未见过的地形中的适应能力,发现GenPO在部分场景中表现优异,但存在过度拟合源环境的风险,易出现冒险行为 [27][25] 核心结论与应用指南 - **算法选择原则**:大规模并行仿真场景优先选择GenPO等近邻类方法;真实机器人、资源受限场景优先选择DIPO等动作梯度类方法;高精度长时程任务选择动作梯度类或Q加权类方法 [31] - **未来研究方向**:包括动作块与轨迹规划、安全强化学习融合、多智能体在线扩散策略强化学习、逆强化学习整合以及分层强化学习架构等 [31]
人形机器人与强化学习交流群来啦~
具身智能之心· 2026-01-20 17:30
行业动态与社群建设 - 行业正围绕具身智能的核心领域“人形机器人”与“强化学习”技术,建立专业的技术交流社群,旨在汇聚相关领域的研究与从业人员 [1] - 社群对从事强化学习、人形机器人相关方向的专业人士开放加入 [1]
VLA任务的成本马上被干到了白菜价......
具身智能之心· 2026-01-20 17:30
行业趋势:具身智能与VLA任务硬件成本快速下降 - 用于VLA任务的机械臂价格在过去两年内急剧下降,从2年前的单臂30,000元以上,降至1年前约15,000元,目前“能用”的具身科研臂价格已低于5,000元 [1][2] - 低成本机械臂(如5,000元以下产品)的出现,使得实现π0、π0.5等各类VLA任务的门槛大幅降低 [2] 市场痛点:初学者进入VLA领域面临多重障碍 - 尽管硬件成本下降,但初学者在复现VLA任务时仍面临“成本太高”的困扰,且开源低成本机械臂存在调试困难的问题 [3] - 打通数据采集、VLA模型、训练优化、部署全流程对初学者而言非常困难,特别是在π0、π0.5、GR00T等模型的训练中存在许多“trick” [4] - 许多学习者将大量时间“浪费”在踩坑上,缺乏有效的学习路径和实战指导 [4][6] 公司解决方案:推出面向实战的VLA课程 - 公司基于SO-100机械臂和LeRobot平台,复现了ACT、GR00T、π0、π0.5等方法,旨在解决学习者缺乏真机、真机昂贵及不知如何上手的问题 [8] - 公司联合业内VLA专家开发了国内首个《面向实战与求职的VLA小班课》,课程内容涵盖机械臂硬件、数据采集、VLA算法、评测、仿真、主流模型部署、VLA+世界模型、真机实验及具身产业讲解 [9][14] - 该课程被描述为公司目前最大、最完整的课程,采用软硬结合的方式,课程已正式开课并提供社群交流 [15][17] 课程附加价值与硬件支持 - 购买课程的学员将获赠一套SO-100机械臂(包含示教臂和执行臂) [19] - 课程项目经验可写入简历,课程中学习的“trick”可作为面试答案,帮助学习者节省自行摸索的时间 [12] - 课程为录播形式,购买后2年内支持反复观看,并提供VIP群答疑服务 [27] 目标用户与课程要求 - 课程面向正在具身领域求职、需要实战项目的学生;VLA领域的入门及进阶者;从事具身智能研究的本科生、硕士生、博士生;希望从传统CV、机器人或自动驾驶领域转行的人员;以及对具身智能感兴趣的其他人员 [26] - 课程对硬件有建议配置:推理建议使用RTX 3060及以上显卡,训练建议使用2张以上RTX 3090 Ti显卡,学员也可自租云服务器资源 [26] - 学员需具备一定的Python和PyTorch基础,课程目标包括掌握真机调试与数据采集、掌握各类VLA算法在真机上的部署、以及对VLA模型量化有深入了解 [26] 预期学习成果 - 完成课程后,学员将对具身产业和落地有清晰认识,简历上可获得足够多的项目支撑,学习成果相当于具备1-2年以上的算法工程师经验 [32]
你的模型真的能打吗?操作任务的长尾场景评测来了
具身智能之心· 2026-01-20 08:33
文章核心观点 - 上海交大等研究团队提出GM-100基准测试,旨在解决当前机器人学习领域数据集任务设计单一、评估标准不统一的问题,通过100项多样化、具挑战性的任务全面评估机器人智能体能力,并推动行业向任务多样化与复杂化发展 [1][4] 现有机器人数据集与评估的局限性 - 当前主流数据集如Open X-Embodiment整合了22种机器人、160,266项任务,Agibot收集了超过100万条轨迹,RoboCOIN为421项任务提供了18万余条演示数据,但任务设计多集中于“拾取并握持”等常见行为,缺乏对复杂和长尾任务的覆盖 [3] - 任务设计的单一化导致训练出的模型存在显著偏差,作为预训练模型时,在真实场景中的适用性受限 [3] - 多数研究在提出新方法时,仅在少数常见任务上测试,且缺乏统一标准,使得不同研究成果之间难以进行公平对比 [3] GM-100基准测试的设计理念与方法 - GM-100包含100项精心设计的任务,旨在涵盖各类交互场景与长尾行为,其设计基于对现有任务设计的系统性分析与扩展,并结合了人类-物体交互基元与物体功能特性的相关洞见 [1][4] - 任务设计不以真实世界任务的实用性为标准,而是将物理常识与底层操作知识作为生成与筛选任务的唯一准则,以避免人为偏差 [4] - 设计过程首先收集并分析现有研究(如Agibot、Open X-Embodiment)的任务,去重分类后,参考HAKE、PaStaNet、OCL等人类-物体交互研究的洞见,利用大型语言模型(如Qwen3)自动生成大量候选任务,再通过模型评分和五名人类专家筛选,最终确定高质量、可执行的任务 [9][10] GM-100的数据收集与实验设置 - 通过遥操作方式在GM-100任务上收集了一个中型数据集,包含超过13,000条轨迹 [11][13] - 数据收集在两款不同的机器人平台(Agilex Cobot Magic和Dobot Xtrainer)上进行,两款平台具有不同的运动学结构、双臂设计和主相机视角,以提供多样化数据 [14] - 对于每个任务,首先收集100条具有不同初始条件和设计扰动的轨迹,以确保多样性,随后再收集30条分布相似的轨迹用于评估过程中的测试用例对齐 [17] - 为验证任务的可行性和挑战性,在100个任务上对多个基线模型进行了评估,包括DP以及多个视觉-语言-动作模型,VLA类模型基于每个任务收集的100条轨迹进行微调 [18] GM-100的评估结果与特性 - 实验结果表明,GM-100的任务具备可执行性以及足够的挑战性,能够有效区分当前视觉-语言-动作模型的性能 [2][4] - 在Xtrainer平台的实际场景性能评估中,不同模型的平均成功率(SR)在1.6%至53.9%之间,部分成功率(PSR)在4.4%至32.1%之间,整体成功率较低,凸显了任务的固有挑战性 [20] - 评估采用了成功率、部分成功率和动作预测误差(均方误差和L1损失)等多个指标,以全面反映模型性能 [22]