全球首个生成式通用具身大脑企业眸深智能获天使轮追加投资
机器人圈·2026-01-15 17:17

公司概况与融资进展 - 公司为全球首个生成式通用具身大脑公司,名为上海眸深智能科技有限公司,成立于2025年 [1] - 公司近期完成超千万人民币天使轮追加投资,投资方为徐汇资本 [1] - 融资资金将用于算力采购、工程化团队扩建及机器人实验平台搭建 [1] - 公司已正式入驻徐汇区人工智能产业核心载体“模速空间” [1] 团队与技术背景 - 团队融合了学术研究能力与全球科技企业的产业化经验,由复旦大学教授陈涛、原英特尔中国首席科学家张益民及连续创业者共同组建 [1] - 创始人兼首席科学家陈涛曾在新加坡华为海思任职,拥有大模型压缩与芯片适配实践经验 [1] - 公司的技术布局早在2021年便已启动,早于行业概念普及,其第一代模型已实现空间动作生成能力 [1] 核心技术:动作生成与泛化 - 公司创新研发“动作基元”技术,将复杂动作序列拆解为上千个基础元素 [1] - 模型可根据自然语言指令,动态调用并组合这些基元,生成全新的未训练过的动作序列,从而具备出色的泛化能力 [1] - 公司开创性地提出业内首个“世界动作模型”,使机器人能够根据外部环境实时反应,实现环境沉浸式动作生成 [4] - 公司是业内唯一打通动作生成、三维世界模型、模型压缩、软硬协同等具身落地全链路的团队 [4] 数据训练与效率架构 - 公司采用独特的三段式训练架构:90%的互联网开源人体运动视频用于预训练,10%的仿真器数据用于微调适配,仅需5%的真机数据进行强化学习校准 [2] - 此架构大幅降低了对高成本真机数据的依赖,同时将新本体的适配周期缩短至数周 [2] 模型轻量化与端侧部署 - 通过自研的模型压缩与推理加速技术,可将模型参数量压缩至原来的1/4,推理速度提升10倍 [2] - 技术成功实现百亿参数模型在机器人端侧芯片上的高效运行,相关研究成果已在IJCAI等顶级学术会议上发表并获奖 [2] 三维感知与交互能力 - 三维感知与交互能力由LL3DA模型提供,该模型是全球首款点云驱动的三维多模态具身视觉问答和任务推理大模型 [2] - 该模型可直接处理三维点云输入,支持语言、图像、视频等多模态指令,助力机器人沉浸式理解环境并完成任务规划 [2] 产业化进展与商业合作 - 公司技术已进入产业化验证阶段,已与宇树科技、国地中心、禾川科技、小米集团等多家行业头部企业达成业务合作 [6] - 公司累计获得上千万元订单收入,当前订单主要源于其动作数据生成服务能力 [6] 落地场景规划 - 公司明确聚焦工业物流搬运与家庭健康养老两大垂直领域 [6] - 在工业物流搬运场景中,模型需满足动态避障、多机协同等核心需求 [6] - 在家庭健康养老场景,则计划推出从安全监护到肢体辅助的渐进式服务 [6] 商业模式与战略定位 - 公司立志成为机器人领域的通用“大脑”供应商,专注于为全球多样化的机器人本体提供可高效部署的智能核心,而非涉足硬件制造 [6] - 公司认为具身智能产业生态将朝着分工协作的方向发展,单一公司难以垄断全栈业务 [6] - 公司将聚焦“世界动作模型”这一核心层,凭借轻量化、泛化能力强的技术优势,赋能下游本体厂商与集成商 [6] - 未来,公司将以“世界动作模型+端侧+场景”为核心路径,持续推进技术突破与产业融合 [6]

全球首个生成式通用具身大脑企业眸深智能获天使轮追加投资 - Reportify