统一架构

搜索文档
统一框架下的具身多模态推理:让AI放下海德格尔的锤子丨自变量机器人
创业邦· 2025-06-19 17:50
具身智能行业发展趋势 - 当前最先进的机器人仍无法实现人类直觉式工具使用,每次交互都需重新识别和规划工具使用[2] - 行业突破需从多模态模块融合转向端到端统一架构,消解视觉、语言和行动间的人为边界[3] - 现有主流方法存在表征瓶颈和信息压缩损失,阻碍跨模态深度理解[5] 自变量机器人技术架构 - 公司提出统一模态架构,将所有模态信息转换为共享高维token序列[7] - 采用多任务多模态生成作为监督机制,强制建立深层跨模态对应关系[7] - 通过Transformer核心整合多模态信息,实现感知推理行为的无损双向交互[9] 统一架构的核心优势 - 实现符号-空间推理能力,将抽象图形解构为具体操作[13] - 具备物理空间推理能力,理解结构稳定性并预测操作结果[15] - 展现自主探索能力,整合视觉观察与常识知识构建推理链[16] - 支持从视频学习人类意图,实现超越模仿的协作决策[19] 范式转换的关键特征 - 传统系统存在模块间延迟和信息损失,统一架构实现实时多模态耦合[21] - 新架构使机器人能并行处理物理属性理解、任务作用认知和动作规划[22] - 该转变是让AI具备跨模态因果推理能力的必要架构进化[22] 公司融资进展 - 2024年完成光速光合领投的Pre-A++轮融资[3] - 近期宣布完成数亿元Pre-A+++轮及数亿元A轮融资[3]