Manipulation Foundation Model
搜索文档
斯坦福博士们联合创立,这家具身智能机器人创企完成近2亿元新一轮融资!
Robot猎场备忘录· 2025-08-04 08:02
融资动态 - RoboScience(机科未来)完成近2亿元天使轮融资,由京东领投,招商局创投、商汤国香资本跟投,老股东零一创投继续追投 [2] - 公司累计完成两轮融资,2025年3月获零一创投数千万元种子轮融资 [3] - 京东2025年7月领投第四家具身智能创企,此前已领投智元机器人B+轮、千寻智能PreA+轮(近6亿元)、众擎机器人Pre-A++轮和A1轮(近10亿元)及逐际动力新一轮融资 [4] 公司背景 - 公司成立于2024年12月,2025年3月正式运营,由前苹果技术主管田野与新加坡国立大学助理教授邵林联合创立 [6] - 核心团队学术与产业结合:CEO田野师从吴恩达,曾任苹果主任工程师;首席科学家邵林师从Leonidas J Guibas,提出SAM-RL和D(R,O) Grasp方法;联创刘朋海曾任科沃斯副总裁,主导产品营收从8亿增至80亿;联创汪涛曾任商汤国香资本募资负责人 [8] 技术路线 - 核心技术基于Model-based RL+Manipulation路线,推出Manipulation Foundation Model,实现机器人、物体、任务三维泛化 [9] - 采用快慢脑分层端到端模型,与Figure AI等全球头部企业同步选择双系统架构VLA模型(视觉-语言-动作拆分) [9] - 建立仿真+视频+真实数据系统,覆盖多维度物体和任务,降低数据成本 [10] 商业化与行业趋势 - 产品应用于工业、物流、消费零售、家庭场景,提供软硬一体解决方案 [10] - 全球具身智能创企分三类:专注大模型(如Physical Intelligence)、人形机器人本体、两者兼顾;国内穹彻智能专注大模型,智元机器人等走软硬全栈路线 [11] - 行业争议点:软件(大模型)是长期竞争力关键,但智元机器人等主张软硬件全栈迭代才能胜出 [12] 行业动态延伸 - 京东以"投资+自研+生态"全面布局具身智能:自研团队由中山大学教授林倞带队,通过Joy Inside平台与十余家机器人品牌合作 [4] - 科技大厂与车企加速入局:2025年产业派与科技厂通过自研+投资双路径进入赛道 [4] - 全球华人学者在具身智能领域表现突出,如卢策吾、王鹤、许华哲等斯坦福/伯克利背景团队受资本青睐 [8]
京东 再投具身智能
上海证券报· 2025-07-30 23:10
融资情况 - 公司完成近2亿元天使轮融资 由京东领投 招商局创投 商汤国香资本跟投 老股东零一创投继续追投 慕石资本担任独家财务顾问[2] - 公司注册成立于2024年12月底 从2025年3月开始正式运营 在本轮融资前已完成数千万元种子轮融资[2] 投资方战略布局 - 京东在具身智能领域投资动作频频 2025年5月以来已投资智元机器人 千寻智能 逐际动力和众擎机器人等多个具身智能企业[2] - 京东将在2025世界机器人大会上展示具身智能领域最新进展 业务布局和生态建设[2] 创始团队背景 - 创始人兼CEO田野本科毕业于中国科学技术大学物理学院 硕士毕业于斯坦福大学AI Lab师从吴恩达 曾任苹果公司设备端机器学习平台团队技术负责人[3] - 在苹果任职7年间主导开发多项里程碑式AI技术 包括全球首个端云协同大模型推理系统Apple Intelligence 首个端侧推理系统 多计算单元协同计算系统 编译融合系统和端侧动态神经网络[3] - 构建苹果全平台AI应用生态 支撑数千款应用落地 服务超10亿用户和20亿设备[3] - 创始人兼首席科学家邵林是新加坡国立大学计算机系助理教授 本科毕业于南京大学地球科学系 博士毕业于斯坦福大学AI Lab师从Jeannette Bohg[3] - 邵林提出的深度神经网络架构UniGrasp成为数据驱动灵巧手抓取基准方法 跨实体灵巧抓取方法D(R,O)获ICRA 2025机器人操作与运动最佳论文奖[3][4] - 2020年开展Concept2Robot项目探索自然语言与视频结合用于学习机器人操作任务 是VLA方向早期工作之一[4] - 提出的SAM-RL方法获RSS 2023最佳系统论文奖提名[4] - 联合创始人刘朋海曾任科沃斯集团副总裁 凯航电机总经理及战略委员会和机器人产品委员会核心成员 具备产品量产与商业化落地经验[4] - 联合创始人汪涛曾是商汤国香资本募资负责人 具备企业投融资 交易结构设计 M&A和IPO项目经验[4] 技术路线 - 公司采用快慢脑分层端到端模型 快脑承担实时响应与动态调整如多关节协同控制 实时力反馈适配和底层物体操作技能 发挥小脑作用保障操作精准[5] - 慢脑专注深度逻辑解析与长周期任务规划如解读复杂说明书拼装家具 分析拆解人类示范打领带步骤 充当大脑统筹全局任务[5] - 实现完全自主推理 零遥操作 高精度 高复杂度和抗干扰的长程具身操作[5] - 全自主研发仿真物理引擎 从第一性原理出发定义Object Trajectory物体状态变化为具身智能标准数据格式[5] - 实现规模化获取与使用仿真数据 视频数据及真实数据 覆盖日常生活各类物体 任务与场景[5] - 通过跨类型数据融合提升模型泛化能力 借助仿真与真实数据互补验证 保障数据质量同时大幅降低采集成本[5] 核心技术 - 自主研发Manipulation Foundation Model作为多模态大模型与物理世界的桥梁 实现三大维度泛化 指导任意机器人 操作任意物体 完成任意任务[6] - 以抓取操作为例 相比现有基于特定物体和特定机械臂的方法 实现与硬件解耦 在成功率 姿态多样性及计算速度上均有显著提升[6] - 跨实体通用具身智能Cross Embodiment AI作为核心技术模块 搭配基于快慢脑系统机器人学习框架与自监督训练开发的具身操作系统 构成产品智能核心[6] 应用场景 - 公司产品可根据场景需求高效适配不同配置硬件 灵活拓展落地场景[6] - 将机器人软硬一体智能模块与整机系统广泛应用于工业 物流 消费零售 家庭等多个领域[6] - 在多场景下提供快速 安全 智能以及人性化的解决方案[6]
「RoboScience」完成数千万种子轮融资,致力于打造全球领先的具身智能大小脑模型及产品
钛媒体APP· 2025-03-31 09:56
公司融资与成立背景 - 具身智能公司RoboScience(北京机科未来科技有限公司)于近日完成数千万人民币种子轮融资,由零一创投独家投资[1] - 本轮融资资金拟用于产品研发和团队搭建[1] - 公司成立于2024年,由前苹果技术主管田野与新加坡国立大学助理教授邵林共同创立[1] 核心团队与技术背景 - 创始人兼CEO田野毕业于中国科学技术大学物理系(专业第一),后于斯坦福人工智能实验室深造,师从吴恩达[2] - 田野曾是苹果总部最年轻的主任工程师之一,在苹果工作7年期间作为技术主管,领导团队打造了苹果的机器学习平台,支撑了相机、Siri、Apple Intelligence等AI应用及CoreML、ARKit等AI生态框架,其技术服务了数亿用户和数十亿设备[2] - 创始人兼首席科学家邵林目前为新加坡国立大学助理教授,博士毕业于斯坦福大学[3] - 邵林在具身智能领域学术成果突出,其合作发表的SAM-RL方法论文曾入围国际机器人顶会RSS最佳系统论文奖,其团队提出的D(R,O) Grasp方法获得了CoRL MAPoDeL Workshop最佳机器人论文[3] 核心技术:操作基础模型 - 公司基于大规模预训练思路,于2024年上半年推出了Manipulation Foundation Model(统一操作大模型)[5] - 该模型旨在成为视觉语言大模型与物理世界的桥梁,实现了三个维度的泛化:指导任意的机器人、操作任意物体、完成任意任务[5] - 在抓取操作方面,该方法相较于基于特定物体和特定机器手的现有方法,在操作成功率、姿态多样性以及计算速度方面均取得显著提升[5] 技术路线:快慢脑分层模型 - 公司自成立之初即坚定选择快慢脑分层模型的技术路线,这与海外明星公司Figure的探索方向一致[7] - 另一明星公司Physical Intelligence最新发布的模型也从端到端VLA模型转向了分层模型[7] - 公司认为该路线实现了执行与规划分层,且两者各自通用[7] 数据获取与模型迭代 - 针对具身智能领域数据来源的挑战,公司已建立规模化获取并使用仿真数据、视频数据和真实数据的系统[7] - 该系统覆盖了日常生活中各种类型及维度的物体和任务,提升了数据质量并降低了数据成本[7] 商业化路径与市场洞察 - 公司产品规划基于其技术的高度泛化能力,将根据落地场景的具体需求,高效适配不同配置和性能的硬件,以拓展落地场景并提升落地效率[8] - 公司选择此路径基于三点市场洞察:1) 未来不同场景需要不同的硬件设备,难以用统一硬件覆盖所有任务;2) 背靠中国供应链优势,硬件成本快速下降,此时推出通用操作软件模型有利于发挥供应链优势;3) 软件研发迭代速度显著快于硬件,与硬件厂商合作能将公司团队在软件方面的产业经验与技术优势最大化[8] - 公司创始人田野希望RoboScience能够站在技术和人文的交汇点上,成为人类的朋友和帮手[8]