端到端具身智能大模型

搜索文档
接连获光速光合、美团等投资,自变量机器人的端到端突围
21世纪经济报道· 2025-05-26 12:14
公司技术优势 - 自变量机器人自主研发的端到端通用具身智能操作大模型WALL-A仅用二指夹爪即可完成拉拉链、叠衣服、浇花等复杂操作,任务成功率高达95%以上 [1] - WALL-A模型基于大规模通用知识预训练与多任务学习机制,在新任务场景中展现出零样本泛化能力,这是实现通用机器人的关键标志 [8] - 公司采用"端到端的一体化模型架构",突破以往单一专有任务训练模式,显著提高跨任务学习效率,在国内具身智能领域处于领先地位 [2][4] 融资与市场表现 - 自变量机器人在成立不到一年半时间内已完成7轮融资,累计融资金额超10亿元,最新A轮融资由美团战投领投 [1] - 高盛预测到2035年人形机器人市场规模将达1540亿美元,公司瞄准养老护理、家庭服务等增量市场 [12] - 公司计划今年在多个功能性场景实现商业化落地,推动技术范式向产品范式转变 [9] 团队背景 - 创始人兼CEO王潜是清华大学电子工程系毕业生,曾在神经网络研究中率先提出注意力机制,其成果成为Transformer架构的关键 [3] - 联合创始人兼CTO王昊是北京大学计算物理博士,曾任粤港澳大湾区数字经济研究院大模型团队算法负责人 [4] - 研发团队90%以上成员来自世界知名人工智能/机器人实验室及顶级高校,兼具机器人+大模型双重经验 [4] 行业发展趋势 - 具身智能被视为下一代机器人革命的核心,需要软件算法与硬件本体的紧密结合 [2][4] - 行业未来可能呈现百花齐放局面,不同企业将在细分场景积累认知,衍生更多垂直应用 [12] - 数据采集能力决定大模型泛化能力,大规模低成本真实数据积累对智能程度提升具有重要价值 [9] 产品战略 - 公司同步自研机器人本体,形成"软硬一体"闭环能力,已在多步骤复杂任务场景中落地应用 [9] - 构建了以模型驱动的数据闭环体系,自主研发数十个数据处理模型和多代数据采集设备 [9] - 长期目标是让每个家庭拥有机器人保姆,预计人形机器人在C端规模化落地还需5-7年 [9]
自变量机器人:中国团队自研全球顶尖“机器人大脑”丨光合说
创业邦· 2025-05-26 08:03
光速光合投资理念与策略 - 光速光合以"思考、专注、探索、创新"为投资信仰,注重长期主义价值,通过深度行业研究寻找创新机会 [2] - 投资风格强调与创业者长期相伴,拒绝短期投机行为,案例包括对具身智能公司自变量机器人的早期支持 [2] - 在机器人赛道形成系统化布局,从硬件公司宇树科技到软件公司自变量机器人,构建完整产业链视角 [21] 自变量机器人技术突破 - 推出全球最大端到端通用具身智能操作大模型WALL-A,仅用二指夹爪即可完成拉拉链、叠衣服等复杂操作,任务成功率超95% [3][12] - 模型展现零样本泛化能力,在未训练场景中成功抓取异形玻璃杯、折叠揉皱T恤,操作复杂度达国际领先水平 [14][15] - 采用端到端一体化架构突破传统分层模型限制,直接处理多模态输入并输出动作指令,显著提升系统灵活性 [7][10] 行业竞争格局与市场前景 - 具身智能领域全球竞争者稀少,自变量机器人与美国Physical Intelligence(PI)技术相当,部分指标实现超越 [15] - 中国供应链优势显著,数据采集成本仅为美国1/10,硬件人才生态优于硅谷大厂"金手铐"困境 [7][8] - 高盛预测2035年人形机器人市场规模达1540亿美元,公司瞄准养老护理、家庭服务等增量市场 [22] 创始团队与技术路径 - 创始人王潜为清华大学硕士、南加州大学博士,2016年即开始研究端到端架构,论文成果成为Transformer注意力机制前身 [6] - CTO王昊曾开发国内首个多模态开源大模型"太乙",团队研发人员占比超90%,具备算法与硬件协同能力 [11] - 坚持软硬一体同步迭代,自研机器人本体与数据采集设备,构建模型驱动的数据闭环体系 [17] 商业化进展与未来规划 - 成立一年半完成7轮融资累计超10亿元,获美团战投等机构加持,2024年启动多场景商业化落地 [3][19] - 当前模型水平相当于GPT-2向GPT-3过渡阶段,预计1-2年内出现类GPT-3水平的具身智能大模型 [19] - 长期目标为家庭服务机器人,预计5-7年实现C端规模化落地 [19][23]