Workflow
Thinker大模型
icon
搜索文档
盘点下国内外那些做具身感知的公司们!
具身智能之心· 2025-10-08 10:49
文章核心观点 - 具身智能已成为全球新焦点 打造通用本体和大脑是创业公司、资本和产业界高度关注的突破方向[2] - 文章旨在全面梳理具身大脑领域国内外知名公司 分析其技术特点、产品布局和应用场景 为行业提供全景图[2] - 重点关注开发机器人"大脑"系统的企业 包括具身大模型、多模态感知决策系统等[3] 国内公司分析 自变量机器人 - 公司成立于2023年 聚焦"通用具身大模型"研发 以真实世界数据为主要来源构建具备精细操作能力的通用机器人[6] - 技术路线偏向"大脑" 坚持走端到端的具身通用大模型路线 成立不到两年已完成8轮融资[6] - 代表成果包括2024年10月推出的WALL-A模型 为全球目前最大参数规模的具身智能通用操作大模型Great Wall系列成员 能整合视觉、语言与运动控制信号实现感知到执行完整闭环[6] - 另一成果为开源具身智能基础模型Wall-OSS 具备强大泛化性和推理能力[6] 星海图 - 公司于2023年9月成立 专注于提供智能导航等大脑相关技术方案 坚持"一脑多形"理念[6] - 通过构建环境地图、路径规划等功能 为机器人在复杂环境中自主行动提供支持[6] - 代表成果为具身基础模型EFM-1 采用"快-慢双系统"模型架构 实现从感知理解到控制的闭环决策[6] 优必选 - 公司成立于2012年 是全球人形机器人商业化领导者 拥有全栈自研能力包括运动控制、关节模组、AI-Embodied系统等[10] - 作为国内人形机器人领域标杆企业 已在全球市场建立广泛品牌影响力和市场份额[10] - 代表成果为2025年自主研发的百亿参数基座多模态大模型Thinker 在机器人感知与规划领域三大国际权威基准测试中斩获四项全球第一[10] - 技术成果包括3D扩散策略DP3 仅需10次人类演示即可让机器人学会复杂操作任务 真实场景成功率高达85%[10] - 空间智能引擎RSR为全球首个real2sim2real引擎 实现低成本三维环境重建与仿真训练[10] 智元机器人 - 公司成立于2023年2月 聚焦AI与机器人深度融合 致力于打造世界级领先的通用具身智能机器人产品及应用生态[10] - 代表成果为2025年3月发布的智元启元大模型 基于Vision-Language-Latent-Action架构 融合多模态大模型与混合专家技术[10] - 该模型具有小样本快速泛化能力 任务成功率较市面模型提升32% 支持"一脑多形"的跨本体应用[10] - "具身智脑"分层系统包括云端超脑、大脑、小脑、脑干等部分 形成完整控制体系[10] 银河通用 - 公司成立于2023年5月 为核心技术与产品构建了三大技术壁垒 在合成数据驱动的多模态大模型方面自主研发全球首个"通用具身大模型"[10] - 采用"大脑+小脑"协同框架[10] - 代表成果包括全球首个端到端具身抓取基础大模型GraspVLA 展示无需大规模真实数据、仅通过合成数据达到基础模型预训练的能力[14] - GroceryVLA模型为首款面向零售商业化的端到端大模型 支持复杂零售场景下的精准商品识别与取送[14] - TrackVLA为产品级纯视觉端到端导航大模型 支持自然语言指令驱动 具备零样本泛化能力[14] 千寻智能 - 公司成立于2024年 为国内领先的AI+机器人全栈生产力级技术能力的具身智能公司 团队成员来自顶尖高校和知名企业[14] - 代表成果为Spirit V1 VLA模型 是国内首个攻克柔性物体长程操作难题的AI模型 通过视觉-语言-动作融合实现自然语言指令驱动的复杂任务[14] 星动纪元 - 公司由清华大学交叉信息研究院孵化 研发具身智能以及通用人形机器人技术和产品 聚焦通用人工智能前沿应用[14] - 代表成果为端到端原生机器人大模型ERA-42 是国内首个端到端原生具身大模型 支持机器人完成超过100种动态任务[14] - 该模型通过视频训练快速学习技能 降低数据采集成本 实现跨任务、跨本体迁移[14] 逐际动力 - 公司聚焦具身智能机器人研发与制造 围绕本体硬件设计制造、基于强化学习的全身运动控制、具身大脑训练范式三大核心技术构建具身Agent开发工具链[14] - 代表成果包括LimX VGM具身智能操作算法 利用视频生成技术推动具身大脑突破[14] - LimX DreamActor为全新具身智能训练范式 首次实现Real2Sim2Real、模仿学习和真机强化学习的深度结合[15] 穹彻智能 - 公司聚焦"以力为中心"的具身智能大模型和相关基础设施研发 为不同行业提供通用机器人智能解决方案[18] - 穹彻具身大脑结合先进算法和数据支持 具备指令推理、任务规划、物体分类、环境感知、自主导航等全闭环能力[18] - 代表成果穹彻具身大脑由实体世界大模型和机器人行为大模型组成 Noematrix Brain 2.0新增实体概念学习能力 支持3D模仿学习框架和视-触觉融合网络[18] 智源研究院 - 成立于2018年11月 核心目标是聚焦人工智能原始创新和核心技术 推动人工智能理论、方法、工具、系统和应用取得变革性、颠覆性突破[18] - 代表成果RoboBrain 2.0是新一代具身视觉-语言基础模型 以70亿和320亿参数的两种规格实现感知、推理与规划能力统一[18] 国外公司分析 Figure AI - 公司成立于2022年 总部位于美国硅谷 致力于开发具备人工智能能力的人形机器人以解决劳动力短缺、危险工作环境和老龄化社会等问题[21] - 代表成果Helix为通用视觉-语言-动作模型 采用独特"双系统"AI架构模仿人类"直觉"和"思考"的认知模式[21] Physical Intelligence - 公司成立于2023年1月 为美国具身大脑初创公司 专注于开发能为各类机器人和机器添加高级智能的软件[24] - 目标创建通用机器人系统的人工智能 将用于构建语言模型的技术与控制和指导机器的技术相结合[24] - 代表成果包括2024年10月31日发布的首个机器人通用基础模型π0 以及近期新开源的π0.5模型 后者采用"知识隔离"训练方法提升开放世界场景泛化能力[24] 谷歌DeepMind - 由DeepMind和Google Brain于2023年合并而成 聚焦通用人工智能研究 致力于开发能理解和适应物理世界的智能系统[24] - 代表成果Gemini Robotics基于Gemini 2.0的视觉-语言-动作模型 可直接控制机器人执行复杂任务 具备通用性、交互性和灵巧性[24] - Gemini Robotics-ER专注于具身推理 Project Astra为概念AI助理 集成Gemini技术通过摄像头和传感器理解物理环境[24] 英伟达 - 全球领先图形处理器设计公司 已发展为涵盖芯片设计、系统平台、软件生态、云计算服务、人工智能解决方案的全栈计算公司[24] - 代表成果Eureka系统基于GPT-4打造 可自动训练实体机器人动作指令 支持30余种复杂动作 具备零样本生成、编写代码和语境改进等能力[24] - GR00T N1开源模型采用双系统架构 包括快速反应的"系统1"和认知决策的"系统2" 实现接近人类运动控制能力[25] Skild AI - 美国领先机器人"大脑"研发企业 目标研发通用机器人操作系统 帮助机器人理解不同应用场景并驱动机器人自主实现智能精细化操作[28] - 代表成果Skild Brain通过摄像头图像和关节反馈直接控制机器人动作 采用分层架构适用于各种四足机器人、人形机器人、桌面机械臂、移动机械手等[28] Covariant - 专注于为机器人构建基础AI模型的公司 技术依赖于机器人与现实世界的交互产生的体验和反馈[28] - 代表成果RFM-1为世界上首个基于真实任务数据训练的机器人大模型 是参数80亿的transformer模型 支持任何模态输入、预测任何模态输出[28] 知名团队研究 - Meta和CMU联合打造RoboAgent 核心在于多任务动作分块Transformer架构 通过在现有机器人经验基础上创建多样化语义增强集合来倍增离线数据集[30] - Stanford李飞飞团队VoxPoser核心思想是利用VLM和LLM常识知识 借助模型生成代码将常识知识映射到三维空间供运动规划器使用 实现零样本合成日常操纵任务轨迹[30]
中科院院士冷劲松:人形机器人的“身体”革命
经济观察报· 2025-09-20 17:55
具身智能产业发展路径 - 产业界存在两种不同发展路径:一种是以优必选、智平方为代表的企业聚焦人工智能大模型技术投入商业和工业场景 另一种是以冷劲松院士团队为代表的从底层智能材料入手重构机器人"身体"的路线 [1][3][18] "身体"革命:智能材料创新 - 冷劲松团队研发的智能材料可根据电、磁、光、热等外界激励主动改变形状、软硬和功能 目标替代传统电机成为未来机器人"肌肉" [2][10][11] - 智能材料柔性太阳能帆板已成功应用于商业卫星 实现国际首次作为主电源在轨展开 将传统"炸、弹、锁"三步展开流程简化为单一平稳动作 [5][7][8] - 智能材料在工业制造领域应用:新能源汽车碳纤维储氢气瓶制造中使用可变形模具 解决异形芯模取出难题 [9] - 生物医疗领域应用:可降解智能高分子材料制作心血管支架 两年后自行降解吸收 降低长期血栓风险 [10] - 其他应用场景包括:根据湿度变化的智能服装 自适应车速的汽车外形 自动升降的应急防洪坝 可重复擦写盲文纸 [10] "大脑"竞速:AI算法与感知系统 - 智平方与惠科子公司达成合作 未来三年将部署超过1000台VLA大模型驱动的具身智能机器人进入半导体显示生产基地 [2][14] - VLA大模型通过端到端数据驱动实现"从感知到行动"自主能力 解决传统机器人柔性作业难题 采用人形轮式设计适配现有工厂环境 [14] - 优必选获得2.5亿元具身智能人形机器人采购合同 为全球人形机器人领域最大合同 Walker系列累计获得近4亿元合同 [14][15] - 优必选百亿参数多模态大模型Thinker在微软、谷歌等机构发起的三大国际机器人权威测试中获得四项全球第一 [2][15] - 帕西尼公司聚焦触觉感知系统 自研高精度阵列式触觉传感器 建立具身智能数据采集工厂 [15] - 帕西尼全模态数据集"OmniSharing DB"在北京国际大数据交易所上架 成为可流通的标准数据资产 [15] 产业发展现状与挑战 - 中国在变形智能材料基础研究论文数量全球最多 但产品化方面可能在未来五到十年被日本和德国公司抢占先机 [16] - 产业面临共同挑战:如何将技术优势转化为具备成本效益和长期可靠性的商业化产品 [18]
具身大脑风云榜!盘一盘国内外具身大脑的灵魂人物们...
自动驾驶之心· 2025-09-15 07:33
文章核心观点 - 具身智能已成为全球焦点 国内外公司正积极开发机器人"大脑"系统 包括具身大模型和多模态感知决策系统 [2][3] 国内公司技术布局 - 自变量机器人聚焦通用具身大模型研发 以真实世界数据构建具备精细操作能力的通用机器人 [4] - 星海图成立于2023年 坚持端到端的具身通用大模型路线 成立不到两年完成8轮融资 [5] - 星海图推出WALL-A模型 为全球最大参数规模的具身智能通用操作大模型 能整合视觉 语言与运动控制信号 [5] - 星海图开源具身智能基础模型Wall-OSS 具备强大泛化性和推理能力 [5] - 优必选为全球人形机器人商业化领导者 拥有全栈自研能力包括运动控制和AI-Embodied系统 [6][9] - 优必选Thinker大模型在三大国际权威基准测试中斩获四项全球第一 显著提升机器人感知与规划能力 [9] - 智元机器人聚焦AI与机器人深度融合 推出启元大模型Genie Operator-1 任务成功率较市面模型提升32% [7][9] - 智元机器人建立"具身智脑"分层系统 包括云端超脑 大脑 小脑和脑干 形成完整控制体系 [9] - 银河通用构建三大技术壁垒 自主研发全球首个"通用具身大模型" 采用大脑+小脑协同框架 [8][9] - 银河通用推出GraspVLA模型 全球首个端到端具身抓取基础大模型 仅通过合成数据达到预训练能力 [9][13] - 千寻智能Spirit V1 VLA模型攻克柔性物体长程操作难题 实现自然语言指令驱动的复杂任务 [10][13] - 星动纪元研发端到端原生机器人大模型ERA-42 支持机器人完成超过100种动态任务 [11][13] - 逐际动力聚焦具身智能机器人研发 构建具身Agent开发工具链 推动多领域应用 [12][13] - 穹彻智能聚焦以力为中心的具身智能大模型 其Noematrix Brain 2.0新增实体概念学习能力 [14][16] - 智源研究院推出RoboBrain 2.0 以70亿和320亿参数实现感知 推理与规划能力统一 [15][16] 国外公司技术进展 - Figure AI致力于开发具备AI能力的人形机器人 解决劳动力短缺等问题 [17] - Figure AI推出Helix模型 采用独特双系统AI架构模仿人类直觉和思考的认知模式 [17] - Physical Intelligence专注于为机器添加高级智能 发布机器人基础模型π0和π0.5 [18][21] - 谷歌DeepMind推出Gemini Robotics模型 可直接控制机器人执行复杂任务 [19][21] - 谷歌DeepMind开发Gemini Robotics-ER 增强机器人对空间和物理世界的理解能力 [21] - 英伟达Eureka系统基于GPT-4打造 支持机器人实现30余种复杂动作 [20][25] - 英伟达GR00T N1开源模型采用双系统架构 实现接近人类的运动控制能力 [25] - Skild AI研发通用机器人操作系统Skild Brain 通过摄像头图像直接控制机器人动作 [22][25] - Covariant构建RFM-1模型 为世界上首个基于真实任务数据训练的80亿参数机器人大模型 [23][25] 知名研究团队成果 - Meta和CMU联合打造RoboAgent 采用多任务动作分块Transformer架构 [24][25] - 斯坦福李飞飞团队开发VoxPoser 利用VLM和LLM常识知识实现零样本机器人操纵 [24][25]
国内外那些做具身大脑的公司们......
具身智能之心· 2025-09-13 12:03
文章核心观点 - 具身智能已成为全球焦点 重点关注开发机器人"大脑"系统的企业 包括具身大模型和多模态感知决策系统 [2][3] 国内公司技术布局 - 自变量机器人聚焦通用具身大模型研发 采用端到端技术路线 成立不到两年完成8轮融资 [4][6] - 星海图专注于智能导航技术 坚持"一脑多形"理念 开发具身基础模型EFM-1采用快-慢双系统架构 [5][6] - 优必选拥有全栈自研能力 Thinker大模型在三大国际权威基准测试中斩获四项全球第一 [7][10] - 智元机器人发布启元大模型 采用VILLA架构 任务成功率较市面模型提升32% 支持跨本体应用 [8][10] - 银河通用构建三大技术壁垒 自主研发全球首个通用具身大模型 采用大脑+小脑协同框架 [9][10] - 千寻智能开发Spirit V1 VLA模型 国内首个攻克柔性物体长程操作难题的AI模型 [11][14] - 星动纪元研发端到端原生机器人大模型ERA-42 支持机器人完成超过100种动态任务 [12][14] - 逐际动力聚焦本体硬件设计制造 基于强化学习的全身运动控制和具身大脑训练范式 [13][14] - 穹彻智能开发Noematrix Brain 2.0 新增实体概念学习能力 支持3D模仿学习框架和视-触觉融合网络 [15][17] - 智源研究院推出RoboBrain 2.0 以70亿和320亿参数规格实现感知 推理与规划能力统一 [16][17] 国外公司技术突破 - Figure AI开发Helix模型 采用独特双系统AI架构模仿人类直觉和思考认知模式 [18] - Physical Intelligence发布π0通用机器人基础模型 采用预训练+后训练模式 π0.5采用知识隔离训练方法提升泛化能力 [19][22] - 谷歌DeepMind推出Gemini Robotics系列 具备通用性 交互性和灵巧性 Project Astra体现具身智能在人机交互应用 [20][22] - 英伟达开发Eureka系统基于GPT-4打造 支持30余种复杂动作 GR00T N1采用双系统架构实现接近人类运动控制能力 [21][26] - Skild AI研发Skild Brain分层架构 适用于各种四足机器人 人形机器人和移动机械手 [23][26] - Covariant开发RFM-1模型 参数80亿 是世界首个基于真实任务数据训练的机器人大模型 [24][26] 知名研究团队贡献 - Meta和CMU联合打造RoboAgent 采用多任务动作分块Transformer架构恢复高性能策略 [25][26] - 斯坦福李飞飞团队开发VoxPoser 利用VLM和LLM常识知识实现零样本机器人操纵 [25][26]