生数科技认领神秘登顶模型:AI视频公司拿出工业级Demo,跨本体跑通复杂长程任务
量子位·2026-04-29 20:46

公司核心产品:MotuBrain通用机器人大脑 - 公司生数科技开发的MotuBrain是一个机器人通用大脑模型,它同时具备世界模型的预测推演能力和输出行动指令的能力,实现了“知行合一”[3] - 该模型于4月中旬在WorldArena和RoboTwin2.0两个国际基准测试中同时登顶,获得全场最高分,是首个实现此成就的模型[4][8][10] - 在WorldArena测试中,MotuBrain在运动质量(Motion Quality)、动作平滑度(Motion Smoothness)等直接对应动作质量的维度上全部排名第一,其综合评分(EWM Score)为63.77[12][28][29] - 在RoboTwin2.0测试中,MotuBrain在50个不同任务中,于标准环境(Clean)和随机扰动环境(Randomized)下平均分分别达到95.8和96.1,均排名第一,并且是唯一在随机环境下平均分超过95的模型[33][34] - 真机演示显示,MotuBrain具备“一脑多型”、“一脑贯通”、“一脑预见”和“一脑多能”四大核心能力,能指挥3台不同型号的仿人机器人完成插花、整理沙发、服务火锅局、调酒等5种复杂长程任务[43][48][60][65] - 该模型能完成10个原子动作级别的复杂长程任务,并且在任务执行中能理解环境、预测变化并自主调整行动,例如在火锅局任务中能判断勺子为空并重新执行舀取动作[49][56][58][59] - 其技术路线为World Action Model,将世界推演与行动决策融合在同一个模型内,实现了更快的响应速度和更优的泛化能力[77][78][79] - 模型基于公司2025年12月开源的Motus世界模型升级而来,采用视频-动作-语言三流MoT架构,实现了感知、理解与行动的统一建模[24][100][105] 公司技术战略与布局 - 公司的技术基座是全球首创的U-ViT架构,该架构能统一处理视觉、听觉、触觉等多模态信息,为模型建立对世界的统一认知[108][109][111] - 公司采取双轨并行的战略:一条路通过世界生成模型(WGM)产品Vidu通往数字世界;另一条路通过世界动作模型(WAM)产品MotuBrain通往物理世界[114][116][121] - 视频大模型Vidu已实现商业化应用,例如为漫威《毒液3》生成宣传片,其AI漫剧《明日周一》上线5天播放量破500万[120] - 公司是极少数同时拥有强大视频生成模型和机器人动作数据积累的玩家,这构成了其独特的竞争壁垒[125] - 2025年4月,公司完成了由阿里领投的近20亿元人民币B轮融资,资金用于支持打通数字世界与物理世界的通用世界模型这一更大叙事[107][135] 行业意义与竞争格局 - MotuBrain在两大基准测试上的成功,验证了将预测世界和驱动行动统一在同一个模型内的技术路线是可行的,解决了业内的“统一场”级别难题[37][39] - 当前具身智能行业的竞争焦点已从造出灵巧的机器人,转向做出真正通用的机器人大脑,这被认为是下一代操作系统乃至通用物理世界的入口[132][134] - 资本正密集涌向研发“大脑”的公司[133] - 公司已与无界动力、深朴智能、星尘智能等企业达成战略合作,共同推进在工业制造、商业服务及家庭等场景的技术优化与规模化落地[128][129][130] - MotuBrain的表现为通用物理智能的发展路径提供了重要验证,表明这条路“已经开始跑通”[137]

生数科技认领神秘登顶模型:AI视频公司拿出工业级Demo,跨本体跑通复杂长程任务 - Reportify