专访中科第五纪黄岩:在具身智能的狂热中,做一位技术实干家
机器之心·2026-03-27 12:09

行业概况与融资热度 - 2026年春季,具身智能赛道迎来狂热浪潮,短短两个月内实现全行业近150亿元融资 [1] 公司核心人物与背景 - 中科第五纪青年首席科学家黄岩,是中科院自动化所研究员与博士生导师,是具身智能全栈技术的代表人物,技术背景覆盖多模态感认知、具身世界模型与强化学习 [2] - 黄岩及其团队的技术探索从真实场景痛点出发,进行全栈式架构重构,旨在解决行业数据利用效率瓶颈 [3] 技术发展路径与前瞻性 - 黄岩在2013年深度学习兴起时,前瞻性地选择了结合视觉与语言的跨界冷门路线,为其后进军具身智能埋下伏笔 [5][6] - 2019年,黄岩团队通过强化学习增强视觉-语言模型的认知机制,在语言驱动的视频行为定位任务上取得国际领先精度,执行效率提升7倍,相关成果入选CVPR Oral论文(前3%) [6] - 团队将强化学习基因延续至多模态大模型时代,推出MM-RLHF成果,系统性将强化学习技术扩展到全方位人类偏好对齐,标志着大模型从能力构建迈向价值对齐 [8] 核心技术与架构创新 - 面对行业普遍试图通过暴力堆叠算力和数据(Scaling Law)催熟具身大脑的路径,黄岩团队持冷静审视态度,选择聚焦真实工业场景,解决样本量少、可靠性低等核心产业痛点 [11][12][13] - 公司基于对数据瓶颈的预判,联合中科院自动化所推出了行业首个超少样本大模型FAM系列,旨在解决工业现场数据匮乏难题 [14] - FAM模型的核心创新在于架构重构,通过将模型中间层从一维特征拉高到三维热力图,实现空间结构信息的无损传递,从而摆脱对庞大数据量的依赖 [16][19] - 该架构赋予机器人“既见森林,又见树木”的认知能力,既能进行全局空间结构建模,又能通过局部注意力机制精准锁定关键操作点 [19][21] - 在真实工业落地中,FAM模型展现出强悍的小样本学习能力,面对新任务仅需3到5条真机演示数据即可完成高可靠性部署,基础任务成功率接近97% [22] - 在基准测试中,其前代模型BridgeVLA在多项任务上平均成功率高达96.9%,显著高于其他对比方法 [23] 安全与世界模型 - 为确保工业场景下的操作安全,公司引入了世界模型技术,推出BridgeV2W世界模型,利用其预见未来的能力让机器人产生更准确、安全的行为 [26] - BridgeV2W通过引入“本体掩码”设计,将机器人的抽象坐标动作实时渲染成二维图像剪影,让预训练的视频大模型能理解动作意图,从而打通视频生成与具身世界模型的桥梁 [26][28] - 该模型在“未见视角”和“未见场景”测试中表现出优秀的视角鲁棒性和泛化能力 [30] 强化学习与推理优化 - 为进一步提升泛化能力并降低交付成本,团队开展了具身强化学习后训练,完成了名为E-TTS的“具身测试时拓展”工作 [31] - E-TTS框架通过推理与动作联合扩展、历史感知的闭环验证、自适应在线选择策略三大机制,提升推理质量对动作的决定性影响 [32] - 该框架无需更新模型权重或收集额外专家数据,极大地降低了落地门槛,并证明在机器人领域,在推理时引入“慢思考”机制比单纯扩大模型规模或数据集更有效 [32] 数据利用与认知模拟 - 团队技术创新的深层驱动力是试图在机器系统中复现人类认知机制,如注意、记忆、推理、决策等 [35][37] - 为激活互联网海量无标注人类操作视频数据,公司提出了EC-Flow流预测框架,让机器人能够“看视频自学” [38][39][41] - EC-Flow通过预测视频中机械臂关键点的运动轨迹,再结合机器人本体配置文件解算出精确行为,在面临高难度任务时,其成功率较当时最佳方案分别提升62%和45% [43] - 在Meta-World基准测试和真实世界操作任务中,EC-Flow均表现出显著优势 [44][45] - 公司还研发了一键生成多视角数据的技术,基于单视角演示数据自动生成多角度高保真训练数据,使用该数据训练后,模型在已知视角和全新视角下的任务成功率最高分别提升18.3%和25.8% [47] 商业化进展与公司实力 - 2026年,行业投资风向转向务实,更看重机器人在真实场景中创造复购率的能力 [52] - 中科第五纪在2026年初一个月内接连完成规模达数亿元的Pre-A及Pre-A+轮融资,获得市场认可 [52] - 公司核心研发团队来自中科院自动化所和清华大学,拥有十余年技术积累,是国内最早投入多模态研发的先驱之一 [53] - 团队在学术与工程上成果丰硕,包括2013年发表首篇视觉-语言理解ICCV论文,2016年将注意力机制引入多模态匹配达到国际领先,2019年投入VLN模型研发并于2023年全球率先实现真机部署 [53] - 公司在多项国际机器人赛事中夺冠,展现了硬核的集体作战能力 [55] - 公司构建了从底层架构到软硬协同的完整交付能力,直接向客户交付具身大脑和机器人 [57] - 硬件方面,公司推出了自研轻量化轮式具身机器人,身高187厘米,具备28个自由度,手臂具备亚毫米级作业能力 [57] - 公司以具身大脑供应商身份与多家知名大型央企展开合作,通过提供统一模型大脑赋能各式硬件,利用规模化出货反哺数据体系 [59] 技术理念总结 - 公司的技术底气源于13年的技术蛰伏,其核心理念是反对盲目算力堆叠,强调通过对底层认知的敬畏和极致的数据利用率,让具身智能与工业需求完美结合 [61][62]

专访中科第五纪黄岩:在具身智能的狂热中,做一位技术实干家 - Reportify