Robotics
搜索文档
全球首个生成式通用具身大脑企业眸深智能获天使轮追加投资
机器人圈· 2026-01-15 17:17
公司概况与融资进展 - 公司为全球首个生成式通用具身大脑公司,名为上海眸深智能科技有限公司,成立于2025年 [1] - 公司近期完成超千万人民币天使轮追加投资,投资方为徐汇资本 [1] - 融资资金将用于算力采购、工程化团队扩建及机器人实验平台搭建 [1] - 公司已正式入驻徐汇区人工智能产业核心载体“模速空间” [1] 团队与技术背景 - 团队融合了学术研究能力与全球科技企业的产业化经验,由复旦大学教授陈涛、原英特尔中国首席科学家张益民及连续创业者共同组建 [1] - 创始人兼首席科学家陈涛曾在新加坡华为海思任职,拥有大模型压缩与芯片适配实践经验 [1] - 公司的技术布局早在2021年便已启动,早于行业概念普及,其第一代模型已实现空间动作生成能力 [1] 核心技术:动作生成与泛化 - 公司创新研发“动作基元”技术,将复杂动作序列拆解为上千个基础元素 [1] - 模型可根据自然语言指令,动态调用并组合这些基元,生成全新的未训练过的动作序列,从而具备出色的泛化能力 [1] - 公司开创性地提出业内首个“世界动作模型”,使机器人能够根据外部环境实时反应,实现环境沉浸式动作生成 [4] - 公司是业内唯一打通动作生成、三维世界模型、模型压缩、软硬协同等具身落地全链路的团队 [4] 数据训练与效率架构 - 公司采用独特的三段式训练架构:90%的互联网开源人体运动视频用于预训练,10%的仿真器数据用于微调适配,仅需5%的真机数据进行强化学习校准 [2] - 此架构大幅降低了对高成本真机数据的依赖,同时将新本体的适配周期缩短至数周 [2] 模型轻量化与端侧部署 - 通过自研的模型压缩与推理加速技术,可将模型参数量压缩至原来的1/4,推理速度提升10倍 [2] - 技术成功实现百亿参数模型在机器人端侧芯片上的高效运行,相关研究成果已在IJCAI等顶级学术会议上发表并获奖 [2] 三维感知与交互能力 - 三维感知与交互能力由LL3DA模型提供,该模型是全球首款点云驱动的三维多模态具身视觉问答和任务推理大模型 [2] - 该模型可直接处理三维点云输入,支持语言、图像、视频等多模态指令,助力机器人沉浸式理解环境并完成任务规划 [2] 产业化进展与商业合作 - 公司技术已进入产业化验证阶段,已与宇树科技、国地中心、禾川科技、小米集团等多家行业头部企业达成业务合作 [6] - 公司累计获得上千万元订单收入,当前订单主要源于其动作数据生成服务能力 [6] 落地场景规划 - 公司明确聚焦工业物流搬运与家庭健康养老两大垂直领域 [6] - 在工业物流搬运场景中,模型需满足动态避障、多机协同等核心需求 [6] - 在家庭健康养老场景,则计划推出从安全监护到肢体辅助的渐进式服务 [6] 商业模式与战略定位 - 公司立志成为机器人领域的通用“大脑”供应商,专注于为全球多样化的机器人本体提供可高效部署的智能核心,而非涉足硬件制造 [6] - 公司认为具身智能产业生态将朝着分工协作的方向发展,单一公司难以垄断全栈业务 [6] - 公司将聚焦“世界动作模型”这一核心层,凭借轻量化、泛化能力强的技术优势,赋能下游本体厂商与集成商 [6] - 未来,公司将以“世界动作模型+端侧+场景”为核心路径,持续推进技术突破与产业融合 [6]
井下百万人的安全,产线百万人的重复:他找到了具身智能该去的地方 | 专访
机器人大讲堂· 2026-01-15 17:10
公司核心定位与创始人背景 - 公司灵宝CASBOT由创始人张正涛创立,其拥有中国科学院自动化研究所的科研背景及近十年工业质检领域的产业经验,致力于将前沿科研与产业现实结合,聚焦具身智能的场景落地[1][3] - 创始人张正涛的职业生涯始于2007年参与国内最早一批仿人机器人动态控制研究,这段经历使其深刻认识到前沿算法与不成熟产业基础间的巨大鸿沟,奠定了“机器人研发必须立足产业现实”的理念[4] - 在2015年前后,创始人深度调研制造业,发现中国有超过十万名专业质检工人(如今已增长至百万规模),用人最多的两个环节是柔性装配和质检,这催生了其首次创业——深耕工业质检领域的中科慧远[6] - 通过服务华为、苹果、京东方等全球头部客户,创始团队将手机玻璃检测效率从人工的36秒提升至自动化装备的1.5秒,效率提高20多倍,并积累了对工业真实需求、大客户商业逻辑及供应链标准的深刻洞察[7] 核心业务概念:具身质检 - “具身质检”概念旨在解决传统自动化质检方案柔性不足的痛点,传统专有装备难以应对不断变化的产品型号(如从2D到3D再到折叠屏)和碎片化场景[9][10] - 公司与中科慧远联合研发了专注于工业质检的“具身质检”机器人CASIVIBOT,其核心是整合了三大通用能力:仿人光学成像的通用“眼睛”、垂类质检大模型的通用“大脑”、以及基于VLA模型的自适应通用“手”[10][11] - 在深圳一家电机厂的实际应用中,该机器人模仿熟练工人操作,检测一片零部件的时间从人工的6秒缩短至5秒,这1秒的提升背后是生产范式的革命,实现了产线更换型号时无需大规模改造的高柔性与通用性[10][12] - “具身质检”机器人不仅是一个执行者,更是一个持续学习、采集高质量数据的入口,可为后台大模型进化提供养料,并可在行业淡旺季时以租赁模式实现跨行业复用[12] 核心业务概念:具身矿工 - “具身矿工”概念体现了公司“AI FOR HUMAN”的品牌理念,旨在用机器人替代人类在危险岗位作业,中国有近200万矿工,井下作业在“钻、装、爆”和“铲、装、运”等环节存在极高风险[12] - 公司与招金集团、中矿集团成立了合资公司“中科深矿”,标志着“具身矿工”构想正式迈向商业化落地,这也是首个人形机器人厂商深度嵌入矿业能源场景的案例[13] - 在矿井下面临粉尘、潮湿、信号不稳等挑战,公司主要攻克三大难题:多智能体协同(与凿岩台车等设备协同)、产品稳定性(防水防尘耐高温设计)、以及在低带宽环境下的低时延远程遥操作技术以保证作业效率[14][16] - “具身矿工”与人类矿工的目标关系是“辅助”与“人机共生”,而非简单替代,旨在让矿工从地下转到地上操作机器人,在更好环境中将经验和技艺传授给机器人,体现科技向善[16] 全栈技术能力与产品矩阵 - 公司构建了从“大脑”到“小脑”再到“本体”与“末端执行器”的全栈技术护城河,以支撑“具身质检”和“具身矿工”的规模化落地[17] - 产品矩阵包括:全尺寸双足人形机器人CASBOT 02,作为技术集大成者用于技术验证和未来家庭场景;轮式具身智能机器人CASBOT W1,作为工业场景落地主力,专注于质检、分拣等任务;高集成度通用轻量版灵巧手CASBOT Handle-L1,作为“场景手”为不同场景提供优化末端执行能力[20] - 核心技术积累包括:通过“大模型+强化学习”及“后训练”模式构建的“大脑”,增强了机器人在复杂长程任务分解上的能力;优化VLA模型并加入力控的“小脑”,使操作更柔顺;以及经过多轮设计验证测试迭代、确保工业环境稳定运行的可靠“本体”[21][23] 产业生态角色与未来展望 - 公司正从技术先行者成长为产业生态共建者和标准制定参与者,其参与共建的“工业具身智能北京市重点实验室”由中国科学院自动化研究所牵头,公司承担具身本体研发、量产制造及行业部署等产业化关键环节[22] - 公司已获得一系列权威认可,包括入选北京市“专精特新”中小企业名单,以及创始人当选工信部人形机器人与具身智能标准化技术委员会委员,将实践经验融入国家层面标准体系构建[22] - 公司通过开放合作积极融入产业生态,包括与联想、中信重工的战略合作,以及加入北京市机器人产业协会[25] - 展望未来3到5年,公司的目标是吸纳中国科学院优秀成果,让机器人代表国家队孵化的最高水平,并在多个关键技术上取得突破,最终迈入千家万户[25]
机器人当老师!手把手教你写字,还能看懂你的笔迹个性
机器人大讲堂· 2026-01-15 17:10
核心技术:TeachingBot自适应机器人教学系统 - 系统通过物理交互,手把手地、循序渐进地教人类学习者书写汉字[2] - 系统能真正看懂每个人独特的书写习惯,并据此进行教学[2] - 研究团队来自香港岭南大学数据科学学院、新加坡国立大学计算机学院以及生物医学工程系[2] - 核心技术目标是让机器人获得两种人类教师的顶级能力:一是阅读并理解学生个性化笔迹的能力,二是提供恰到好处、动态调整的物理指导能力[4] 技术原理:个性化建模与动态引导 - 教学前通过高精度传感器记录学习者自由书写时的笔尖运动轨迹,进行摸底[5] - 运用结合高斯混合模型与高斯过程回归的概率模型,分析书写轨迹,生成独家的个人笔迹概率模型[5] - 从标准汉字中提取关键骨架点,并以个人笔迹模型为起点,利用GMR-GP算法生成一条平滑、渐进的个性化引导轨迹[6] - 机械臂装备可变阻抗控制算法,实现动态力道调节[6] - 初始辅导力度根据学习者字迹与标准字的平均偏差进行智能设定[7] - 在运笔过程中,根据偏离轨道的程度动态调节辅助力道,在关键骨架点提供精准辅助,在非关键路段允许自由发挥[7] 实验验证:效果与优势 - 总计30名背景各异的参与者被分为两部分进行实验[9] - 核心对比实验让15名参与者依次体验三种教学方法:传统临摹、机器人硬带、TeachingBot自适应系统[9] - 另一项实验让15名参与者体验混合引导方法,以验证TeachingBot“量身定制路径”的核心优势[9] - 在衡量整体字形结构相似度的指标上,TeachingBot帮助学习者取得了显著进步[10] - 在更精细的笔画细节精度指标上,TeachingBot的提升幅度显著优于传统临摹与机器人硬带两种方法[10] - 使用TeachingBot时,学习者主动施加的交互力更大,表明其参与感、主动性和内驱力被激发[12] - 可视化图表显示,随着TeachingBot多轮引导,学习者笔迹从最初的散乱逐渐向标准字形收敛聚焦[13] 应用前景与行业影响 - TeachingBot验证了一套完整的、可推广的“物理技能自适应教学”框架[19] - 其个性化建模-渐进引导-动态调参的范式,几乎可以移植到任何需要手把手教的领域[19] - 潜在应用领域包括:康复领域(如帮助中风患者重建精细动作)、职业教育(如培训外科医生、飞行员)、艺术教育(如引导绘画、音乐初学者)、远程教育[19] - 文章末尾列举了广泛的机器人行业相关企业,涵盖工业机器人、服务与特种机器人、医疗机器人、人形机器人、具身智能企业、核心零部件企业及教育机器人企业等多个细分领域[21][22][23][24][25][26][27][28]
模力工场 028 周 AI 应用榜:AI “身体”觉醒,从工业前线到情感陪伴
AI前线· 2026-01-15 14:58
模力工场活动与社区动态 - 模力工场作为OceanBase合作的创新社区,将于1月31日亮相上海OceanBase社区嘉年华并拥有专属展位,活动旨在通过AI Coding、开放麦分享、行业交流等方式,探索开源精神与AI创造力的结合 [2] - 活动流程包括多场主题演讲与圆桌对话,涵盖从RAG到Context Engine构建AI Agent数据基座、可定制Agentic Voice AI、开源内容生态、TEN Framework搭建低延时对话式AI Agent等前沿技术话题 [5][6][7] - 活动设有Demo Show、社区大使计划发布等环节,并有多个技术社区作为合作方参与,包括FastGPT、CAMEL-AI、LangChain Community等 [9][13] 第028周AI应用榜单趋势 - 本周AI应用榜单显示,上榜应用多来自美国CES展及阿里云通义智能硬件展,共同趋势是AI硬件正跨越“工具”属性,进化为具备理解环境、自主规划、闭环执行及情感交互能力的“智能体”或“数字生命体” [16] - 榜单应用清晰地展示了AI从虚拟世界走向物理世界的趋势,在工业与消费两大关键赛道爆发:工业领域聚焦效率革命,消费领域则满足情感陪伴需求 [20] 工业领域AI硬件进展 - 云深处巡检机器人具备强运动与感知能力,可在无网络支持的复杂工业环境中自主完成巡检任务并安全返回,已在电力、能源等领域落地,实现了从“自动化”到“自主化”的跨越 [16][20] - 优必选提供从智能搬运机器人到集群调度系统的软硬件一体化智慧物流方案,帮助企业实现仓储搬运自动化升级与效率提升 [16][20] - 银河通用机器人具备视觉识别与自主抓取能力,可在动态环境中完成物品拣选等任务,并实现了“零样本抓取”能力 [16][20] - 众擎机器人聚焦高动态双足人形机器人研发,致力于突破拟人步态与平衡控制技术,旨在为机器人无缝进入人类环境提供通用移动能力支撑 [16][21] 消费与内容创作领域AI应用 - Walulu是一款具备情感交互与离线记忆能力的AI智能毛绒玩具,通过多模态交互提供个性化、可长期互动的陪伴体验,其核心价值在于创造情感价值与“数字亲密关系” [16][18][20] - OiiOii是一款AI互动式内容生成应用,通过自然语言或轻量交互快速生成可分享的内容 [16] - 模力小A推荐的AI动画创作应用采用“全流程托管模式”,由七个分别扮演导演、编剧、美术等角色的AI智能体分工协作,将用户文字想法自动转化为包含分镜、角色与场景的动画视频,大幅降低了专业动画制作门槛 [17][21] AI硬件产业范式演进 - AI硬件已越过简单功能叠加与语音助手阶段,进入以“智能体化”为特征的第三阶段,产业致力于创造能自主行动的“数字生命体”而非“能联网的工具” [21] - AI正在改写生产力与生产关系的定义:在工业场景成为可靠的“数字员工”,在消费领域成为可建立羁绊的“数字伙伴”,标志着人机协同进入新历史阶段 [16][21]
卧安机器人涨超11% 近日发布人形具身智能机器人onero
智通财经· 2026-01-15 11:29
公司股价与市场表现 - 卧安机器人股价大幅上涨,截至发稿涨幅达11.54%,报116港元 [1] - 公司股票成交活跃,成交额为2508.32万港元 [1] 核心产品发布 - 公司于近日正式发布名为onero的人形具身智能机器人 [1] - onero在CES上进行全球首发,定位为家庭保姆机器人,专为真实家庭场景打造 [1] - 该机器人以VLA模型为核心,深度融合多模态感知、理解与动作生成能力 [1] - onero具备看懂并理解环境的能力,能完成洗衣、洗碗、做饭、收纳等繁琐家务 [1] 业务拓展与市场应用 - 全球首家机器人网球训练场“深圳宝安超网中心云馆”于1月10日开启试运行 [1] - 公司旗下全球首款AI网球机器人Acemate已入驻该中心 [1] - 该产品旨在为运动爱好者提供可随时陪练的机器人运动伙伴 [1]
投资者演示:开门红能否延续?-Investor Presentation-Can the Strong Opening Be Sustained
2026-01-15 10:51
纪要涉及的行业或公司 * 行业:中国宏观经济、科技与供应链、人工智能、机器人、生物科技、房地产、社会消费、财政与货币政策 [1][2][5] * 公司:阿里巴巴、腾讯、字节跳动、百度、快手、美团等中国头部科技公司 [17][18] 核心观点和论据 宏观经济与政策展望 * 中国经济增长目标从数量转向质量,十四五规划(2021-2025)GDP年均复合增长率目标为“高于7%”,但未设定具体目标 [3] * 创新成为核心驱动力,十四五规划期间研发支出年均复合增长率目标为“高于7%”,数字经济核心产业占GDP比重目标增加5.7个百分点 [3] * 预计2026年实际GDP增长放缓至4.8%,2027年进一步放缓至4.6% [81][82] * 预计从2026年开始,政策将逐步从供给侧向消费侧再平衡,但2026年仍以供给侧为中心 [106] * 财政刺激预计温和,2026-2027年财政扩张力度较2025年(广义财政赤字占GDP比重扩大1.1个百分点)有所减弱 [105][112] * 人民币汇率预测上调,但国内经济疲软和通缩仍是拖累,资本流动疲弱 [63][65][68] 科技、人工智能与供应链竞争力 * 中国在产业升级的六个方面具有优势,供应链竞争力深厚,即使在传统行业也难以复制 [8][44] * 人工智能扩散遵循“资本支出先行,生产力后至”的模式,生产力提升预计从2027年开始显现 [11][13] * 预计2026年中国前六大公司的AI资本支出将同比增长11%,达到4450亿元人民币 [17] * 预计中国GPU自给率将在2027年达到50% [17][20] * 中国在AI大模型领域正在追赶,通过“性价比创新”竞争,并拥有庞大的人才库(STEM毕业生)和数据规模优势 [22][25][27] * 中国是全球机器人市场的关键支柱,2024年占全球市场约40%,无人机、服务机器人等领域增长稳固 [30] * 预计到2050年,全球人形机器人累计采用量将达到10.19亿台,其中约30%(约3.02亿台)来自中国 [35][37] * 中国生物科技处于创新黎明,预计到2040年,源自中国的资产将占美国FDA批准药物的35% [39] * 预计到2030年,中国在全球出口中的市场份额将从目前的15%上升至16.5% [48][50] 劳动力市场与社会经济 * 生成式AI在美国对初级职位的替代效应更明显,在中国可能创造巨大的劳动力等效价值,但在转型期替代效应可能占主导 [53][55] * 需要更多政策支持以缓解AI对劳动力市场的冲击,包括加强社会安全网、支持AI导向的教育和职业培训 [56][57] * 中国存在系统性高储蓄问题,自2018年以来积累了约30万亿元人民币的超额储蓄,另有6-7万亿元超额定期存款 [77] * 青年失业率居高不下,私人消费持续疲软 [86][87][88] * 2026年新一轮“以旧换新”计划规模相似但启动较软,汽车和家电的补贴力度和覆盖范围有所调整 [92] 房地产与住房市场 * 房地产投资已基本完成大部分调整,但房价前景仍不确定 [94][98] * 要将一、二线城市的住房库存消化至更健康水平(约12个月),预计需要约3万亿元人民币的资金 [100] * 住房库存消化可能通过社会支出(如转化为保障性住房)而非大规模救助来进行 [99][100] 社会福祉与再平衡 * 中国社会支出占GDP比重不足且存在城乡差距,例如2023年城镇职工基本养老金平均支付额为44,912元,而城乡居民基本养老金仅为2,671元 [127][128][129] * 提高社会福祉支出(如养老金、医疗保险)与省级消费占GDP比重提升呈正相关 [122][123] * 将农村养老金提升至略高于基本生活水平(到2030年每月1000元)在财政上可行,每年额外支出约占GDP的1%,但长期会使系统资金更加不足 [132][133][136] 反“内卷”与供给侧改革 * 全球贸易失衡加剧,中国是原因之一但非全部 [138][140] * 当前的反“内卷”政策(供给侧改革2.0)比2015-2018年的供给侧改革1.0更为复杂,针对中下游行业、民营企业主导,且面临先进产能过剩的挑战 [148][149] * 需要深层次结构性改革来应对系统性产能过剩问题,包括改革财政体系、调整宏观目标、修订官员绩效考核 [143][145] 其他重要内容 * 参考日本经验:20世纪90年代末至21世纪初,日本制造业资本支出增长并未带来工资增长,非贸易部门生产率持续放缓 [58][59][60][61] * 通过“5R”战略(再通胀、再平衡、重组、改革、重燃)评估经济再平衡进展,截至2025年底,各项进展在20%-80%之间 [112] * 中央经济工作会议(CEWC)的政策指引与摩根士丹利预期基本一致,但货币宽松空间有限,住房保障措施表述模糊 [110]
人形机器人动力之源-电机应用要求与变革方向
2026-01-15 09:06
行业与公司 * 行业为人形机器人行业,核心研究对象为应用于该行业的电机技术、产品及市场[1] * 涉及的上市公司或厂商包括:卧龙、伟创、鸣志、雷利、劲杰、信杰、德昌控股(国内)[12][20];科尔摩根、尼德科、Maxon(海外)[12][20] 核心观点与论据 **市场驱动与前景** * 机器人市场当前处于不温不火状态,与整体市场走势一致[5] * 市场受事件驱动:2025年9月初因人形机器人大规模量产预期带动市场上涨;2026年初特斯拉发布JIN3及陆续定点将再次推动市场[5] * 预计2026年2月左右将是机器人赛道的重要时机[1][5] * 未来人形机器人将成为AI最大的物理应用端,市场潜力巨大[1][5] **机器人电机需求与价值** * 人形机器人电机需求与传统电机(如新能源车、工业用电机)存在显著差异,尤其在灵巧手上的应用[1][3] * 机器人动力源正从液压时代转向电动化,以实现更高灵活性和精细度,类比新能源车替代燃油车[2] * 灵巧手使用的空心杯电机和微型无框电机等小众产品,因制作难度高、成本高、生产者少而具有显著研究价值[1][3] * 对于模组厂商而言,掌握电机技术是核心能力[4] **技术路径与变革方向** * 电机设计未来主要有三个变革方向:结构创新(如轴向磁通电机带来更高功率密度)、工作原理创新(如西部市场技术提高转区密度)、控制系统和散热改进(如氮化镓技术提升散热表现)[1][6] * 新兴技术如中央磁动(扁平结构)和平面线绕组(扁线)旨在提升功率密度,但面临工艺成熟度与应用场景(如仅适用于旋转关节)的限制[16] * 特斯拉Optimus的电机技术路径在演变:第二代采用空心杯电机;从2025年起寻求使用无框力矩电机;第三代大概率会采用无芯无框设计替代部分空心杯电机[3][18] **关键产品与市场空间** * 机器人电机主要分为大关节电机和灵巧手电机[17] * 大关节电机:数量约28至30个,每个售价约5,000元[17] * 灵巧手电机(微型无框或空心杯电机):以Optimus为例,手部执行器数量可能达44至50个,每个价格约200至300元,总体ASP(平均售价)可达1万元[1][7] * 灵巧手电机赛道空间较大、生产难度高,能做此类产品的厂商较少[7] * 能成功制造灵巧手所需小型电机的厂商,也具备生产大型无框矩阵式电机的能力,有利于业务扩展[7] **性能要求与选型考量** * 高性能电机的重要性能指标包括:高扭矩密度(动力基础)、高控制精度(影响动作精度)、抗震抗冲击能力、轻量化设计[1][10][11] * 不同工况环境对电机性能提出不同要求(如长时间站立与跑跳所需性能冗余不同),通用性是机器人零部件的关键特性,技术壁垒较高[1][9] * 选择机器人用电机需综合考虑:功率密度、控制精度、电驱动控制研究能力、散热效率、成本控制、质量稳定性[3][19] * 研发阶段需强大研发设计能力,量产阶段需强大供应链管理和批量生产控制能力[3][13][19] **厂商能力与竞争格局** * 电机与控制系统密不可分,其控制精度、响应速度等直接影响机器人性能[3] * 电机调频不佳或运行稳定性不足会导致机器人平衡性丧失;散热能力是关键指标(如2025年马拉松比赛中有机器人需对关节单独喷水散热)[9] * 电机制造挑战包括:不同工况带来的设计难度、批量化制造中的成本管控与质量控制一致性[13] * 基础设计能力对于优秀厂商至关重要,而不仅仅是批量生产能力[15] * 空心杯电机与微型无框力矩电机优缺点及成本: * 空心杯电机优点:重量轻、响应速度快、转速高、无齿槽效应(控制稳定)[18] * 微型无框力矩电机优点:结构紧凑,可直接嵌入关节,实现高度集成化设计[3][18] * 两者成本差距随着产量上升已缩小,目前在20%以内[18] * 最终技术路线(空心杯 vs. 无框力矩)尚未确定,但两者玩家重叠率较高,不会对赛道产生颠覆性影响[8]
500万次围观,1X把「世界模型」真正用在了机器人NEO身上
具身智能之心· 2026-01-15 08:32
文章核心观点 - 1X公司为其人形机器人NEO推出了全新的“1X World Model”大脑,标志着机器人控制范式从依赖海量机器人数据训练的传统视觉语言动作模型,转向了基于互联网规模视频预训练的世界模型,使机器人能够通过“想象”任务过程来规划动作,显著提升了对新任务和环境的泛化能力 [4][6][13] 1X World Model的技术原理与架构 - 技术范式转变:1XWM是一种基于视频预训练的世界模型,与直接从图像-语言输入预测动作的VLA模型不同,它通过文本条件下的视频生成来推导机器人动作,从而能够利用互联网视频中的真实世界动力学规律,无需大规模机器人数据预训练即可泛化到新物体、新运动和新场景 [12][13] - 核心组件:系统包含一个140亿参数的文本条件扩散模型作为世界模型主干,以及一个逆动力学模型,前者负责高保真预测场景演化,后者负责从生成视频中提取精确的动作序列 [18][19] - 训练流程:采用多阶段训练策略,先在互联网规模视频数据上预训练,再用900小时人类第一视角视频进行中期训练,最后用70小时NEO机器人数据进行具身微调,以适配其视觉外观与运动学特性 [18][20] 1X World Model的能力与表现 - 任务泛化:搭载1XWM的NEO能够执行超出既有训练经验的任务,包括抓取分布内与分布外的物体、操作具备复杂可供性的新物体,以及完成需要全新动作模式的任务,如清洁和双手协调操作 [25][26][28][30] - 执行一致性:模型生成的视频与机器人实际执行过程在视觉表现上高度一致,表明其在空间结构理解、运动学约束建模及物理一致性方面具备较强能力 [25][26] - 成功率评估:在系统性实物实验中,1XWM在多种动作原语上保持了稳定的成功率,但倒液体、绘图等对精细操作要求高的任务仍具挑战性,每类任务重复执行30次 [32] - 质量与成功率关联:生成视频的质量与任务成功率存在相关性,例如生成错误视频时成功率几乎为0,通过并行生成多个视频并选择质量最佳者(可借助VLM评估器自动化),可提高任务成功率 [34] 关键训练要素与消融分析 - 字幕上采样:利用VLM为第一视角数据集生成更详细的描述性字幕用于训练,在所有评测数据集上均提升了视频生成质量,因为更细致的字幕与视频模型预训练时的文本条件更匹配,能更清晰引导动作生成 [18][36][41] - 第一视角人类数据:引入900小时人类第一视角视频进行中期训练,显著提升了模型在新任务和分布外场景下的生成质量,为操作任务提供了可迁移的通用先验,且与NEO的类人具身高度契合 [20][36][41] - 数据平衡:在已有大量NEO数据覆盖的分布内任务上,额外加入第一视角人类数据可能会稀释后训练数据分布,对效果提升有限甚至略有负面影响 [42] 市场热度与行业意义 - 技术演示引发高度关注:1XWM的发布推文浏览量已突破500万,显示市场对机器人智能范式进步的高度兴趣 [8] - 行业意义:该技术标志着机器人智能开始直接受益于视频预训练的规模化能力跃迁,为实现通用家庭机器人提供了新的技术路径,其成功离不开为高保真人类具身到机器人具身迁移而设计的整套硬件系统支持 [13]
北京大学谢广明教授团队最新《Science Advances》研究成果:能“装”会“拼”的机器鱼,拓展水下机器人能力的新边界
机器人大讲堂· 2026-01-15 08:00
文章核心观点 - 北京大学谢广明教授团队提出了一种模块化自重构机器鱼群系统,该系统通过模仿鱼类多样运动方式,使单个机器鱼既能独立游动又能按需拼装成不同构型,从而突破传统水下机器人在复杂非结构化水域环境中的能力限制,显著提升了运动性能与任务执行能力 [1] 系统设计与原理 - 每个模块化机器鱼单体具备三个主动自由度,包括用于推进的尾鳍摆动副和用于姿态调整的侧向旋转副,使其既能独立游动,也能在拼装后快速调整相对朝向 [2] - 机器鱼之间通过电永磁铁结构实现纵向与侧向两种拼接形式,该结构不仅能实现稳定的物理连接,还能实现模块间的通信以传输控制指令 [2] 对接策略创新 - 针对水流干扰和单体运动能力有限的挑战,团队受鱼类编队游动启发,提出了一种基于编队的动态协作对接策略,使机器鱼群能选择合适的编队形式完成收敛、靠近并实现稳定可靠的对接 [4][6] 运动性能验证 - 实验表明,机器鱼群通过拼接成不同构型,在游动速度、稳定性、能量转换效率和机动性等关键指标上均获得显著提升 [7] - 在浅水环境中,机器鱼群还能实现爬行运动,完成传统水下机器人难以实现的多模态运动,从而显著提升对复杂地形的适应能力并大幅拓展活动范围 [7] 功能性任务验证 - 机器鱼群能够通过协作完成物体运输、开门操作、复杂地形下的爬行运动,并能重构为抓手构型,实现对大尺寸目标物体的稳定抓取,展示了强大的环境障碍物交互与任务执行能力 [9] - 团队在真实户外水域的野外实验中,初步验证了核心功能的可行性与鲁棒性 [9][10] 研究意义与未来应用 - 该研究突破了传统机器人“特定功能依赖专业性设计”的普遍假设,展示了一种通过模块化设计实现环境适应性与任务多样性的全新技术范式 [11] - 模块化机器鱼群未来有望应用于水面救援、复杂水域探索等关键场景,为应对未知非结构化水域环境中的随机突发任务挑战提供新的技术手段 [11]
全国4成工业机器人8成服务机器人是广货
南方都市报· 2026-01-15 07:14
文章核心观点 - “经典广货”正从传统的轻工业产品加速向高科技、高附加值的“科技广货”蝶变,驱动广东从“世界工厂”向“全球产业创新高地”转型 [2] - 广东以科技创新为引擎,推动产业在全球价值链中向高端攀升,涵盖生物制造、低空经济、人形机器人等未来赛道 [2] 高科技产品制造实力 - 全国40%的工业机器人、80%的服务机器人、18%的集成电路,以及全球70%的消费级无人机产自广东 [3] - 国家统计局统计的104种工业产品中,广东在全国占比超过10%的有44种,超过20%的有23种 [3] - 广东智能手机产业规模、产量和出口量均居全国首位,全球每卖出三台手机就有一台是广东企业制造 [4] - 在折叠屏手机市场,华为、OPPO、vivo、荣耀四家企业占据2025年三季度中国市场份额的90% [4] - 华为、OPPO、vivo、荣耀等品牌加速AI大模型在手机端侧落地,vivo X100系列是全球首个在终端跑通百亿参数大模型的手机 [5] 传统产业转型升级 - 广东拥有制造业31个国民经济行业大类,其中15个规模位居全国第一 [6] - 2024年,广东省纺织服装规上企业数达4240家,其中服装企业约2535家,占全国的18.34%,位居全国第一 [6] - 中山市沙溪镇的智能制造企业通过全流程智能生产模式,使产能提升40%,并将裁片到成衣首件下线时间从3天缩短至0.5-2小时 [6] - 东莞鑫浪纺织专注于功能性面料,产品服务全球137个国家和地区,2024年其冲锋衣销量增幅达40% [7] - 广东溢达纺织实现天然染料工业化生产与染色盐60%回收率,其每年的研发投入已超2亿元 [7][8] 科技产品出口动能 - 2026年1月1日,深圳市普渡科技公司的智能清洁机器人成为今年全国出口第一单,发往东盟、欧盟等市场 [9] - 2025年上半年,广东与新质生产力密切相关的高技术产品出口增长了13.3% [9]