Workflow
具身智能
icon
搜索文档
北大等团队用“分层小脑+仿真分身”让G1零样本上岗
具身智能之心· 2025-11-15 00:03
编辑丨 量子位 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 近日,来自北京大学与BeingBeyond的研究团队提出 DemoHLM 框架,为人形机器人移动操作(loco-manipulation)领域提供一种新思 路——仅需1次仿真环境中的人类演示,即可自动生成海量训练数据,实现真实人形机器人在多任务场景下的泛化操作,有效解决了传统方 法依赖硬编码、真实数据成本高、跨场景泛化差的核心痛点。 DemoHLM的核心创新在于"分层控制+单演示数据生成"双引擎,既保证了全身运动的稳定性,又实现了极低数据成本下的泛化学习。 分层控制架构:兼顾灵活性与稳定性 DemoHLM采用"低层全身控制器+高层操作策略"的分层设计,解耦"运动控制"与"任务决策": 此外,团队为机器人设计了 2DoF主动颈部+RGBD相机 (Intel RealSense D435),通过比例控制器实现"视觉追踪稳定",模仿人类操作 时的视线调节能力,避免物体遮挡导致的感知失效。 核心挑战:人 ...
SemanticVLA:面向高效机器人操作的语义对齐剪枝与增强方法
具身智能之心· 2025-11-15 00:03
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Wei Li等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 一、研究背景 视觉-语言-动作模型在机器人操作领域取得显著进展,通过预训练视觉语言模型实现从语言到动作的端到端映射,推动智能机器人的实际应用。但现有模型在动 态、杂乱环境中部署时仍受两大瓶颈制约: 这些问题导致模型计算效率低下、任务接地能力弱,限制了在实际机器人操作场景中的落地。 二、核心创新点 1. 提出语义引导双视觉剪枝器,通过指令感知的token过滤和几何感知的聚合,针对性解决视觉冗余问题,同时保留语义对齐。 三、主要工作 3.1 整体框架设计 输入包含实时视觉观测、机器人本体感受状态(如关节角度、末端执行器姿态)和自然语言指令,目标是预测未来K个动作序列。框架通过两条并行路径处理视 觉输入: 两条路径的输出通过语义互补分层融合器生成任务相关表示,与指令、本体感受状态及可学习的动作占位符拼接后,输入双向解码器并行生成所 ...
雷军下铺的兄弟,创业具身智能机器人
具身智能之心· 2025-11-15 00:03
编辑丨 量子位 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区: 具身智能之心知识星球(戳我) ,这里包含所有你想要的! 离开小米两年后,雷军下铺的兄弟、小米原副总裁 崔宝秋 ,创业家务机器人。 崔宝秋显然不满足于此。他想要的,或许是一个能将所有"点"串联起来,一个真正能思考、能移动、能与人交互的"AIoT终极形态"。家庭服务 机器人,正是这个答案。 那个曾在小米内部推动技术变革的"教父",如今选择亲自下场,试图将他心中"CBA" (云计算-大数据-人工智能) 与"AIoT"的蓝图,浓缩到一 个能够走进千家万户的智能躯体之中。 然而,投身机器人,并不是他离开小米后的第一站。 这位曾在小米内部挂帅技术委员会的"教父"级人物,正式将他的人生下半场押注在了具身智能这一最火热的赛道。 这不仅是一个资深技术高管的再出发,也标志着他的技术蓝图,从"连接万物"进化到了"改造物理世界"。 这一次,他不再是为"AI大脑"搭建平台,而是要亲手为AI造出一个能走进千家万户的"身体"。 小米"技术教父"投身机器人洪流 告别了小米的庞大体系 ...
绿的谐波(688017):25Q3营收及业绩高增,主业优化,积极推动人形业务拓展
长江证券· 2025-11-14 23:02
投资评级 - 维持"买入"评级 [8][13] 核心观点 - 公司主业受益于工业机器人需求景气、谐波减速器应用场景渗透率提升及公司积极扩产,经营持续向好 [2][13] - 人形机器人业务收入预计继续大幅提升,谐波减速器已切入头部客户量产订单,丝杠验证稳步推进 [2][13] - 2025年第三季度营收及业绩实现高增长,规模效应下毛利率和净利率同比改善 [6][13] 财务表现 - 2025年前三季度实现营业收入4.07亿元,同比增长47.36%;实现归母净利润0.94亿元,同比增长59.21% [6] - 2025年第三季度单季实现营业收入1.55亿元,同比增长49.92%;实现归母净利润0.40亿元,同比增长81.19% [6] - 2025年前三季度销售毛利率为36.60%,同比下降2.93个百分点;净利率为23.35%,同比上升1.64个百分点 [13] - 2025年第三季度单季销售毛利率为39.56%,同比上升1.46个百分点;销售净利率为25.67%,同比上升3.91个百分点 [13] - 期间费用率受益于销售增长摊薄,2025年前三季度同比降低4.26个百分点 [13] 主业经营状况 - 2025年1-9月国内工业机器人产量达59.48万台,同比增长29.80%,行业景气度延续 [13] - 公司谐波减速器作为核心零部件直接受益于下游需求增长,公司通过扩产和提升市占率策略推动产销提升 [2][13] 人形机器人业务进展 - 公司谐波减速器卡位核心客户,国内客户已有量产订单出货,预计人形谐波出货量已占据一定比例 [2][13] - 今年国内人形机器人厂商总体出货量规划在万台级,头部客户明年规划更加积极 [2][13] - 公司积极推进行星滚柱丝杠在人形领域的验证及在非机器人行业应用场景的研发工作 [2][13] 盈利预测 - 预计2025-2026年公司实现归母净利润1.18亿元、1.56亿元,对应市盈率分别为227倍、173倍 [13]
越甲灵动机器狗高交会首秀 携手深圳地铁共筑智慧城轨新标杆
证券日报网· 2025-11-14 21:42
本报讯(记者李春莲)11月14日,第二十六届中国国际高新技术成果交易会(高交会)在深圳宝安国际会展 中心开幕。本届高交会上,越甲灵动(深圳)科技有限公司(以下简称"越甲灵动")旗下越甲灵动机器狗作 为具身智能机器人领域的新锐力量首次公开亮相,并与深圳地铁联合完成了在真实运营环境下的功能演 示。其与深圳地铁联合发布的"具身智能巡检解决方案"并非概念演示,而是已在深圳地铁部分线路投入 实际应用的成熟成果。这标志着具身智能机器人已成功融入城市轨道交通的日常运维体系,开启了智慧 城轨建设的务实新篇章。 高交会作为国家级科技风向标,始终致力于展示可落地、可推广的前沿科技。本次越甲灵动机器狗的登 场,正是这一理念的完美体现。它并非仅为盛会而来,而是带着在深圳地铁一线积累的实战成果而来。 在宝安国际会展中心的聚光灯下,越甲灵动展示的是其在地铁隧道、站厅、扶梯等真实复杂环境中已被 验证的能力,实现了从"展品"到"工业级工具"的价值跨越,为品牌奠定了坚实、可靠的首次公众印象。 越甲灵动机器狗在深圳地铁的价值,体现在它针对性地解决了一系列具体而棘手的运维难题。 其一,全地形巡检无死角:它能够自主通行直梯、扶梯、楼梯,替代人工深入 ...
灵心巧手入选“2025最具潜力初创公司” 在具身智能领域再获突破
证券日报网· 2025-11-14 20:48
本报讯 (记者梁傲男)近日,The Information正式发布"2025年最具潜力50家初创公司"榜单,灵心巧手(北京)科技有限 公司(以下简称"灵心巧手")凭借灵巧手产品成功入榜,这是首次有机器人核心零部件企业入选该榜单。 榜单截图 作为全球科技投资的重要风向标,The Information的年度榜单评选,覆盖全球23个国家的数千家初创企业,从收入规模、 商业模式可行性及长期增长潜力等多个维度进行综合评估。灵心巧手此次成功入选,不仅是国际顶尖科研视野对中国机器人技 术的认可,更标志着中国在具身智能这一前沿科技领域再次取得重大突破。 今年,人形机器人作为具身智能领域的典型业态,迎来发展机遇。在工业制造场景中,精密装配与搬运等精细化操作长期 是自动化升级的难点。传统解决方案或依赖人工操作,效率与稳定性存在瓶颈;或采用进口高端机器人,但动辄百万级的成本 让众多中小企业望而却步。 这一行业痛点,为技术创新者提供了突破空间。灵巧手作为机器人的关键执行部件,其技术成熟度直接决定着机器人在复 杂环境中的操作能力。业内专家指出,灵巧手的研发涉及精密传动、传感器集成、运动控制等多个技术领域,是一个典型的跨 学科创新课题 ...
空间智能系列之三:物理AI:数字孪生、具身智能实现基石
申万宏源证券· 2025-11-14 20:45
报告行业投资评级 - 行业评级:看好 [1] 报告核心观点 - 物理AI是让AI走向现实世界的系统性工程,融合空间智能及世界模型,将引领下一个AI浪潮 [3][5][11] - 物理AI的实现依赖于世界模型、物理仿真引擎与具身智能控制器三大技术协同 [3][16] - 英伟达凭借“芯片-算法-平台”全栈布局,在物理AI领域具备先发优势 [3][25] - 数字孪生是物理AI目前最成熟的应用,智能驾驶与具身智能是未来最具想象空间的两大应用 [3][5][47] - 物理AI产业链已形成清晰的价值分布,各环节均出现重要变化和投资机会 [3][4][72] 物理AI概念与技术框架 - 物理AI核心结构可简化为“空间智能(感知基座)——世界模型(认知及决策中枢)——物理AI(系统整合载体)” [3][5][12] - 空间智能是AI感知、理解和推理三维空间及其内部物体关系的能力,当前先进的多模态大语言模型在空间推理任务上仍逊于人类 [13] - 世界模型为AI系统提供内部物理世界模拟器,使其能够预测行动结果而无需现实试错,学习方式多为无监督学习 [16] - 物理AI与传统AI在处理对象、核心能力、训练数据、技术基础和应用场景上存在显著差异 [24] - 物理AI的实现依赖于三大技术支柱协同:世界模型负责构建三维空间完整理解,物理仿真引擎负责实时计算物理交互,具身智能控制器连接虚拟推理和物理执行 [3][16] 英伟达的生态布局与优势 - 英伟达2019年提出Omniverse作为3D实时协作平台,已构建起较为完整的产业生态护城河 [3][25] - 2025年1月英伟达推出世界基础模型Cosmos并开源,能理解世界语言、物理特性、空间位置等要素,并合成物理数据 [30] - Cosmos模型获得重大更新,包括开源可定制的70亿参数推理视觉语言模型Cosmos Reason和专注于合成数据生成的Cosmos Transfer-2模型 [33][35] - 英伟达已建立完整的物理AI使用流程:构建虚拟3D环境(Omniverse)、生成合成数据(Cosmos)、训练验证(DGX平台)、部署(Jetson Thor等下一代机器人设备) [38][41][42] - Cosmos首批用户包括1X、Agile Robots、Figure AI、小鹏汽车等十余个国内外机器人和汽车厂商 [37] 世界模型进展与商业化应用 - 谷歌DeepMind推出通用世界模型Genie 3,基于文本提示以每秒24帧、720p分辨率生成长达数分钟的交互式3D环境 [43] - 主流世界模型(如Meta V-JEPA、英伟达Cosmos、谷歌Genie3)在核心共性、技术侧重和优劣势上各有特点 [45] - 世界模型在训练端可生成符合物理规律的高质量合成数据,解决真实数据稀缺与长尾场景覆盖问题;在推理端通过物理推理模型实现感知-决策-执行闭环控制 [59][60][65] 物理AI核心应用场景 数字孪生 - 数字孪生是实体资产和流程的虚拟映射,企业借助其优化设计、仿真与运营效率,成为工业数字化转型的核心工具 [48] - 数字孪生通过集成多维数据源构建虚拟模型,并依赖物联网实现数字与物理世界的动态同步 [49] - 该技术为企业带来显著效益,宝马集团通过工厂数字孪生将规划效率提升近30%,纬创实现气流仿真速度提高15000倍 [52] - 数字孪生已渗透至制造业、能源、医疗与城市管理等广泛行业,如富士康通过虚拟工厂优化机器人部署 [54][57] 智能驾驶与具身智能 - 智能驾驶及具身智能目前主流方案包括端到端、VLA(视觉-语言-动作模型)、世界模型 [3][69] - 端到端模型是目前最成熟的前期方案,但因其“黑箱”输出遇到稳定性瓶颈;VLA模型凭借可解释性及LLM模型能力基础表现优异,但对边缘侧算力要求过高;世界模型可实现更前瞻推理,支持复杂思维实验,可能成为未来重要商业化路线 [3][69] - 智能驾驶领域代表厂商:特斯拉(端到端)、小鹏/理想/元戎(VLA)、英伟达/华为/蔚来/Momenta(世界模型) [69] - 具身智能领域代表:Google RT-2(端到端)、Figure(VLA)、DeepMind/Meta(世界模型) [69] 物理AI产业链梳理 芯片及控制器 - 芯片与控制器是物理AI的硬件中枢,承担环境感知、实时计算与运动控制的核心功能 [73] - 英伟达基于Blackwell架构推出Jetson AGX Thor和DRIVE Thor计算平台,Jetson Thor的AI计算能力是上一代Orin的7.5倍,最高达2070 TFLOPS(FP4),能效是上一代的3.5倍 [73][75] - 主控芯片领域呈现多元化竞争格局,除英伟达外,高通、地平线以及小鹏、蔚来等自研芯片厂商均在特定场景实现差异化竞争 [75][76] - 控制器厂商价值量提升,智微智能推出完整的机器人“大脑-小脑”分层方案,天准科技发布新一代千TOPS级高算力具身智能大脑产品星智007 [77][80][81] 数据供应 - 符合物理规律的高质量数据是训练物理AI模型的前提,获取成本与规模构成核心壁垒 [85] - CAE仿真与合成数据生成成为物理AI的“数据工厂”,索辰科技利用多物理场仿真技术生成高保真合成数据 [85][86] - CAD厂商积累大量细分场景下具备物理属性的空间信息,群核科技发布高质量3D高斯语义数据集InteriorGS,包含1000个3D高斯语义场景 [88] - 3D视觉厂商(思看科技、奥比中光、凌云光)负责现实世界感知与数字化,为仿真提供初始模型并进行数据采集校准 [91] 模型和算法 - 模型与算法构成物理AI产业的“智能核心”,产业格局呈现四类主要参与者:全球科技巨头(英伟达、谷歌)、专注于空间智能与世界模型的第三方平台、第三方算法解决方案提供商(如Momenta)、整机厂自研(小鹏、理想、优必选) [95][96][97][101] 落地和应用 - 落地应用是物理AI价值的最终体现,系统集成商与行业解决方案提供商是推动技术赋能千行百业的关键 [102] - 该环节核心竞争壁垒体现在对垂直行业的深度理解、与底层技术平台的深度合作关系以及提供端到端解决方案建立的客户粘性 [102][103] - 亚信科技将自研数字孪生平台、MaaS平台、智能体平台与NVIDIA Omniverse集成融合,为网络、工业制造、城市治理等场景提供一站式数字孪生解决方案 [104] 产业链核心标的 - 控制器:智微智能、天准科技、德赛西威 [3][109] - 数据供应:索辰科技、群核科技(拟上市)、思看科技、奥比中光-UW、凌云光 [3][112] - 模型和算法:索辰科技 [3][112] - 落地和应用:亚信科技 [3][112] - 整机厂商:小鹏汽车-W、极智嘉-W [3][112]
领益智造调整购买资产方案 拟以现金方式收购江苏科达
证券日报网· 2025-11-14 20:41
本报讯(记者王镜茹)11月13日,广东领益智造(002600)股份有限公司(以下简称"领益制造")披露投资 者关系活动记录表。公告显示,收购江苏科达斯特恩汽车科技股份有限公司(以下简称"江苏科达")是公 司在立足主业的基础上,围绕产业升级布局、打造第二增长曲线而开展的商业行为。此次交易将优质资 产纳入上市公司,有助于领益智造在新能源汽车零部件领域强链补链延链,提升企业投资价值。 此前,领益智造公告称,将调整购买资产方案以现金方式收购江苏科达。公告显示,基于当前市场环境 及公司发展规划,公司决定调整发行可转换公司债券及支付现金购买资产并募集配套资金事项,调整原 购买资产方案为以现金方式收购江苏科达控制权。 业内认为,此举将有利于公司加速完成对江苏科达的收购,加速对江苏科达的管理和运营进行整合赋 能,同时进一步扩大领益智造汽车业务的整体规模。公开信息显示,江苏科达是一家专注于汽车饰件总 成产品的研发、设计、生产和销售的国家高新技术企业,拥有各类专利65项,在与整车厂商的长期配套 服务中积累了丰富的配套经验。 本次交易完成后,领益智造的汽车业务将实现从Tier2向Tier1的成功转型,公司将快速切入具备广阔市 场前 ...
7所双一流高校超常布局“具身智能”专业
第一财经· 2025-11-14 20:30
2025.11. 14 本文字数:1339,阅读时长大约2.5分钟 作者 | 第一财经 林靖 高校专业的优化和调整,对应着社会经济发展对专业人才需求的变化。近年来我国专业优化调整频率 加快。随着科技进步、产业结构转型以及社会需求的不断演变,我国本科专业调整范围不断扩大,力 度增强。 根据11月14日教育部网站发布的《具身智能本科专业申报材料公示》,2025年《政府工作报告》明 确提出培育生物制造、量子科技、具身智能、6G等未来产业。为了加强具身智能领域人才培养,根 据全国教育大会"建立科技发展、国家战略需求牵引的学科专业设置调整机制和人才培养模式,超常 布局急需学科专业"的部署, 北京航空航天大学、南京航空航天大学、北京理工大学、北京邮电大 学、东北大学、上海交通大学、浙江大学、西安交通大学等7所高校申请增设"具身智能"新专业。 根据公示,该专业的学位授予门类为"工学",申报类型为"尚未列入目录的新专业"。 当前,我国具身智能产业逐渐成为各界关注的焦点。具身智能是人工智能与机器人学交叉的前沿领 域,强调智能体通过身体与环境的动态交互实现自主学习和进化,其核心在于将感知、行动与认知深 度融合。 《中共中央关于制 ...
这届清华特奖机器人含量爆表!丘成桐(国内版)现身点评
量子位· 2025-11-14 20:10
梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 一年一度"神仙打架"的清华特奖,又到了揭榜名场面! 11月13日下午,本科生特等奖学金15进10刚打完,网上立刻炸开了锅,疑似TOP10入围名单流出了: | | 清华大学特等奖学金 (本科生) | | | --- | --- | --- | | | 投票结果前十名 | | | 序号 | 院系 | 姓名 | | 1 | 电子系 | 林旭煊 | | 2 | 计算机系 | 徐汝一 | | 6 | 交叉信息院 | 李忆唐 | | ರಿ | 美术学院 | 姚祁文 | | 10 | 软件学院 | 黄天予 | | 11 | 未央书院 | 赵杨 | | 12 | 探微书院 | 壬勝 | | 13 | 行健书院 | 陈博沅 | | 14 | 求真书院 | 陈嘉熙 | | 15 | 为先书院 | 石啸容 | △ 最终投票结果以官方公示为准 但这次让网友们刷屏的,不光是谁进了前十,而是,方向太统一了!今年几乎一半都在搞具身智能。 此外,答辩现场还出现了一个"大彩蛋"—— 菲尔兹奖、沃尔夫奖获得者,数学界的"天花板人物" 丘成桐 院士本人登场站台,直接把答辩逼格拉满!!! 把今年 ...