文章核心观点 - 锦秋基金连续两轮投资星尘智能,看好其作为绳驱AI机器人定义者和量产先行者的技术领先性与商业化潜力 [1] - 星尘智能的核心技术优势在于其独特的绳驱传动设计,模仿人类肌腱运动,实现高表现力与高安全性的结合,适用于复杂灵巧操作和人机交互场景 [1] - 星尘智能与北京通用人工智能研究院提出的ControlVLA框架入选顶会CoRL,该技术解决了预训练VLA模型在真实场景中数据稀缺与泛化不足的难题,是具身智能落地的关键突破 [1][3] 星尘智能公司概况 - 公司是业界首个量产绳驱AI机器人的企业,其Astribot S1机器人已在科研、商业服务、文娱演出及工业等多个领域落地应用 [1] - 公司结合AI大模型与具体场景探索,推动机器人行业应用加速与商业化落地 [1] ControlVLA技术框架核心突破 - 技术核心突破体现在三重设计:物体中心表示机制、ControlNet风格微调架构、双注意力结构 [2] - 物体中心表示机制通过分割跟踪任务相关物体并提取特征,让模型聚焦关键操作目标,摆脱背景干扰 [2] - ControlNet风格微调引入零初始化的KV投影层,在保留预训练模型通用先验的同时逐步整合任务特定特征,避免知识遗忘 [2] - 双注意力结构扩展交叉注意力机制以同步捕捉视觉与物体特征,提升决策精准度 [2] ControlVLA技术性能优势 - 在数据效率上,仅需10-20个演示即可在8类真实任务中实现76.7%的成功率,远超传统方法的20.8% [2][6] - 仅20个演示就能达到传统方法100个演示难以企及的80%成功率 [2] - 在泛化能力上,对未见物体和陌生背景仍能保持稳定性能,并可支撑长序列决策任务 [2] - 在落地成本上,无需依赖模拟数据或预构建模块,大幅降低机器人在家庭服务、工业自动化等场景的部署门槛 [2] ControlVLA实验验证结果 - 在涵盖刚性、软体、流体处理等8项真实世界任务的实验中,总体成功率达到了76.7%,显著超过基准方法20.8%的成功率 [12][31] - 在长时任务中,ControlVLA性能超过当前最先进的方法,成功率约为后者的3倍 [31] - 数据缩放实验显示,仅需20个演示样本,方法就能达到80%的高成功率,而基准方法需要100个以上演示样本仍无法达到该水平 [45] - 对未见过物体和背景的泛化测试中,平均成功率分别达到70.0%和60.0%,显示其强大的环境适应能力 [48] 行业影响与意义 - ControlVLA的设计思路为预训练VLA模型的高效适配提供了范式参考,推动具身智能从实验室多数据环境走向真实世界数据稀缺场景 [3] - 该框架填补了大规模VLA模型预训练与高效目标中心适配之间的空白,使机器人能够通过极少的演示样本获取复杂技能 [12] - 通过将演示样本需求降低到实际可行的水平,该技术为机器人在各类场景中的部署降低了门槛 [49]
锦秋基金被投星尘智能ControlVLA入选顶会CoRL | Jinqiu Spotlight
锦秋集·2025-09-28 12:08