Workflow
银河通用
icon
搜索文档
最近面向具身科研级的硬件好像越来越多了......
具身智能之心· 2025-10-14 08:02
行业现状与商业模式 - 当前大量机器人公司,包括元老级公司和新兴具身智能公司,其产品均面向科研场景,业务涉及高校 [1] - 教育场景的落地模式主要包括提供科研本体、组织赛事、线下基地建设和学科建设等 [1] - 行业内存在明显的错位竞争,公司分别专注于提供灵巧手、完整机器人本体、视觉系统(眼睛)或具身大脑等不同环节 [1] 社区资源与平台服务 - 社区已完成产业、学术、求职、问答交流等多个领域的闭环,提供问题解决方案和前沿研究思路 [3] - 社区汇总了超过30种技术路线,涵盖基准测试、综述和学习路径,以缩短用户检索时间 [4] - 社区邀请了数十位来自产业界和学术界的具身智能领域专家,提供答疑解惑服务 [4] - 社区与近2000名成员及200家公司和机构建立了联系,提供学术进展、工业应用和交流机会 [76] - 社区汇总了40多个开源项目、60多个数据集以及行业主流仿真平台 [13] 技术研究与发展方向 - 技术研究覆盖数据采集、灵巧手、VLA模型、VLN模型、多传感器融合、分层感知操作、机器人操作系统、协同感知、机器人模型、Sim2Real泛化、具身世界模型、触觉感知、大模型规划推理、模型加速与微调等多个领域 [5] - 具体技术议题包括机器人仿真与数据采集平台、人形机器人模仿学习、VLA在抓取与规划中的应用、VLA+RL方法、sim2real挑战、分层决策与端到端方案比较等 [4] - 社区为不同基础的学习者提供了从入门到进阶的多种学习路线,包括具身智能感知、交互、强化学习、VLN、VLA、多模态大模型、Diffusion Policy等 [13][14] 行业生态与基础设施 - 社区汇总了国内外具身智能领域的高校实验室和机器人公司,涵盖教育、宠物、工业、救援、物流、交互、医疗等多个方向 [13][19] - 基础设施资源包括行业研报、机器人相关书籍、零部件品牌(芯片、激光雷达、相机、IMU、底盘等)、ToF与3D相机厂家、数据采集方案、开源数据集和仿真平台等 [16][19][21][24][25][27][29][31][33][35][37]
人形机器人产业:迎来跨越发展 赋能千行百业
科技日报· 2025-10-14 07:08
产业发展现状与前景 - 人形机器人产业在"十四五"时期实现跨越式发展,从"技术验证期"向"规模化商用期"快速过渡 [1] - 2025年全球具身智能市场规模预计达195.25亿元,中国市场占比近半 [1] - 人形机器人已加速融入工厂、医院、家庭等实体产业,应用场景包括商场导购、工厂搬运、养老陪护等 [1][4] 核心技术突破 - 具身智能技术取得突破,其结构归纳为负责感知决策的"大脑"(AI大模型)和控制运动平衡的"小脑"(运动控制算法) [2] - AI大模型的飞速发展推动人形机器人从"机械执行"向"智能体"跨越,显著提升感知、决策及自然交互能力 [2] - 中国在具身智能大模型构建上取得进展,已有模型能使用低成本硬件完成精细操作和复杂任务 [2] - 运动控制技术研发聚焦稳定行走与精细操作,如Walker机器人展示双足行走与手部操作能力,"天工"机器人实现复杂环境自主导航 [2] - 感知算法、伺服电机、减速器等核心部件的持续突破大幅提升机器人灵巧度、稳定性和自主性 [3] 行业应用案例 - 银河通用Galbot机器人已"入职"汽车智慧工厂,承担自动质检、零部件分拣与搬运等复杂任务,并能基于视觉感知自主规划路径 [4] - 优必选Walker S机器人在比亚迪新能源汽车工厂完成15公斤物料的快速搬运 [1] - 陪伴型机器人"悟空"已进入数千家庭,能与儿童互动并通过AI识别情绪提供个性化陪伴 [4] - 傅利叶GR-3机器人在养老院为老人提供服药提醒和跌倒监测服务 [1] - 医疗康复领域,外骨骼人形机器人协助中风患者重新学习行走,并通过AI算法提供个性化康复方案 [5] 未来发展趋势与挑战 - 人形机器人正从"专用"向"通用"方向发展,多家企业致力于开发能适应多种场景的通用型机器人 [5] - 未来通用型人形机器人将能理解人类意图、主动适应环境,成为智能伙伴 [5] - 当前面临成本、可靠性、智能化水平等多重挑战,价格较高主要源于核心零部件研发和制造成本 [5] - 随着量产和技术成熟,成本预计将逐步下降 [5]
Figure 03惊艳发布,但二级市场并不买单
Robot猎场备忘录· 2025-10-11 08:02
文章核心观点 - 文章认为Figure 03的发布是具身智能机器人赛道在四季度的首个利好催化事件,但其对二级市场相关产业链的催化效果有限,市场反应冷淡 [2] - 文章指出人形机器人行业的共识是长周期和广阔前景,当前创企的难点在于批量化生产和实现场景的有效应用,技术壁垒和核心的“大脑”突破仍面临挑战 [22] Figure 03产品详解 - **整体定位与设计**:Figure 03专为Helix系统、家庭使用及全球规模化应用而设计 [2] - **自主性与演示**:公司创始人宣称其展示视频中的操作为AI自主完成,遥控含量为0,但未透露单个动作的成功率 [4] - **Helix系统**:搭载新一代感知组件与手部系统,以发挥自研通用型视觉语言动作模型Helix的最佳性能 [4] - **家庭场景优化**:通过新增柔性织物外层、支持无线充电、升级音频系统及提高电池安全性等措施,使机器人在家庭环境中更安全易用 [4] - **大规模制造能力**:相比Figure 02,Figure 03几乎所有零部件重新设计,为高产量制造而设计,建立了完整供应链并对关键模块实行垂直整合 [4][17] - 制造工艺从CNC加工转向压铸、注塑与冲压等模具化工艺,单台制造成本大幅下降 [17] - BotQ制造基地首期产线年产能为12,000台,计划未来四年内累计生产10万台 [4] - **全球应用潜力**:依托Helix系统,具备成为通用型产品的潜力,通过解决家庭场景的复杂性促进商业场景落地 [4][18] Figure 03技术升级 - **新的视觉系统**:采用新一代视觉系统,实现了两倍的帧率、四分之一的延迟以及每摄像头60%的视场角拓宽 [5] - **数据处理与学习**:具备10 Gbps毫米波数据卸载功能,允许整个机器人团队上传TB级数据用于持续学习和改进 [7] - **手部系统**:每只手集成广角低延迟摄像头,指尖采用更柔软材质,并自研第一代触觉传感器,可检测低至3克的压力 [9] - **为家庭场景的设计**:采用多密度泡棉防夹设计,外层覆盖可定制的柔性织物,相比Figure 02,新机重量减少9%,体积显著缩小 [13] - **无线充电**:脚部集成充电线圈,支持2kW无线感应充电,可自主完成,电池系统通过UN38.3国际标准认证 [15] 行业现状与挑战 - **商业化卡点**:行业面临从算力、软件算法、数据、核心零部件到工程化等多层面的商业化挑战 [22] - **企业现状盘点**:需要从产品进展、硬件设施、产品落地场景、宣布量产时间、实际商业化进展及具身智能大模型技术等方面,盘点全球人形机器人企业现状 [22] - **创企困境**:目前生产人形机器人本体和通过战略合作实现营收并不难,真正的难点在于批量化生产和实现场景真正、有效的应用 [22] - **技术壁垒**:号称软硬件全栈自研的技术壁垒仍有待商榷,众多具身智能创企尚未建立真正护城河,作为核心瓶颈的机器人“大脑”突破道阻且长 [22] 市场观点与行业动态 - **市场对Figure 03的反应**:尽管Figure 03获得行业内人士称赞,但二级市场完全不买单,相关产业链公司忽视该利好催化 [2] - **对特斯拉Optimus的误读**:文章澄清了关于特斯拉已放弃今年数千台Optimus生产计划的虚假利空消息 [2] - **行业领袖观点**:美国初创公司Starcloud联合创始人兼CEO Philip Johnston转发表态,认为除人形机器人外,其他任何形态的机器人都将被击败 [20] - **行业共识**:人形机器人赛道具有长周期和广大前景 [22]
科技云报到:找到真场景,抓住真需求,这样的具身智能才是好AI
搜狐财经· 2025-10-10 13:10
行业定义与市场前景 - 具身智能是人工智能的下一站,其核心是让机器具备在物理世界中“行动”的能力,应用场景涵盖工厂搬运、养老陪伴乃至太空探索 [1] - 全球人形机器人市场规模预计到2027年将达到173亿美元,复合年增长率为63.5% [3] - 高盛预测在理想情况下,到2035年人形机器人市场空间有望达到1540亿美元,花旗银行则预测到2050年全球市场规模将达7万亿美元,机器人数量将达到6.48亿台 [3] 技术挑战与商业化瓶颈 - 当前具身智能商用化面临成本高企、效率低下和数据瓶颈等挑战,例如波士顿动力的Spot机器人售价高达20万元,优必选的Walker机器人搬运箱子耗时数分钟,效率远低于人类 [1] - 实现商业成功需要颠覆性创新,以跨越从“技术可行”到“商业成功”的鸿沟,并找到其不可替代的价值锚点 [1] 场景应用与价值体现 - 具身智能的价值需通过场景落地体现,已在制造业、医疗健康、零售、能源、物流、建筑等多个传统行业产生显著技术红利 [3] - 在制造业的真实场景中,有效的AI解决方案需能兼容不同设备数据、过滤环境干扰、并联动生产管理系统实现流程闭环,而非仅作为单点工具 [4] - 蚂蚁集团旗下的灵波科技R1机器人具备多模态感知和交互能力,可担任导游、分拣药品、提供健康咨询或执行厨房任务,并在部分实际场景试点 [6][10] - 在工业和救援等高危场景,机器人可替代人类完成巡检、现场清理、电箱操作、生命信号扫描和生命救援等危险任务 [10][11] 商业模式演进与典型案例 - 蚂蚁集团正推动AI应用从“卖工具”进入“卖成果”时代,其Tbox超级智能体可基于自然语言指令,在10分钟内自动调度20余位专家智能体生成约15页的可视化报告并上线可交互网页,并推出“按成果计费”套餐 [15] - 数字蚂力推出的“AI数字员工团队”采用“人机融合”全托管模式,为客户提供“确定性的业务结果”,其中AI数字客服团队可帮助中小企业提升约70%的人效,降低35%的运营成本,并在电商实践中带来约10%的GMV增长 [16] - 蚂蚁数科的智能体平台Agentar已覆盖银行、证券、保险等金融场景,推出超百个智能体解决方案,重新定义金融机构的人机协作模式 [16] 政策支持与产业动态 - 2025年全国两会上,“具身智能”作为未来产业的重要组成部分首次被写入政府工作报告 [6] - 2025年行业动态频出,包括宇树科技人形机器人上架开售、深圳地铁启用智能安检机器人、北京举办全球首个人形机器人马拉松比赛等 [3][6]
智元机器人,成立即冲一线!却被高成本困住机器人商业化的脚步
搜狐财经· 2025-10-10 10:24
公司融资策略与股权结构 - 公司在两年内完成11轮融资,估值达到150亿元,融资节奏密集但偏好引入腾讯、比亚迪、京东等产业资本而非纯投资机构[3] - 公司股权结构集中,创始人邓泰华直接和间接持有58%的股份,高瓴资本通过两只基金合计持股约6.67%,腾讯投资持股2.63%[6] - 凭借集中的股权结构,公司迅速完成对上纬新材的收购,已收购29.99%股份并计划最终获取63.62%股份,上纬新材市值达533亿元[6] 产业合作与战略协同 - 比亚迪在2023年8月入股时持股3.76%,最新持股为2.38%,合作超越财务投资,比亚迪的工厂可作为试验场,公司技术可解决比亚迪生产线自动化难题[5] - 产业资本的引入旨在提前绑定产业合作,实现相互借力,比单纯获取资金更有价值[5] 核心技术团队与研发能力 - 核心团队由华为资深人士组成,创始人邓泰华在华为任职20多年,曾管理5G、通信基站业务,并牵头构建鲲鹏、昇腾AI芯片生态[8] - CTO彭志辉(稚晖君)原为华为昇腾计算产品线全栈研发工程师,公司GO-1通用具身基座大模型能快速落地多模态感知技术,其逻辑与华为盘古大模型相似[10] - 团队背景使公司跳过技术断层,显著缩短机器人决策系统的研发周期[10] 产品定位与市场策略 - 公司产品灵犀X2定价在10万至40万元,与宇树科技R1的3.99万元起售价形成显著差异,反映其依靠技术构建护城河、优先站稳高端市场的策略[12] - 市场策略侧重于长远发展,不急于通过低价竞争抢占入门级市场,风格与华为先筑墙再扩张的模式类似[12] 商业化进展与量产目标 - 公司宣布2026年量产目标为数万台,银河通用亦提出2026年规模增长2-3倍的目标[1] - 公司于2024年12月启动通用机器人商用量产,2025年1月完成第1000台下线,并与宇树科技共同中标中国移动1.24亿元的人形双足机器人代工服务采购项目[14] 行业挑战与潜在风险 - 公司计划2026年70%的产品通过合作伙伴销售,但面临订单能否跟上的挑战,若工厂和家庭订单不足,数万台量产可能转化为库存压力[16] - 行业存在同质化竞争风险,各家比拼空翻和量产规模,公司需在工业场景定制化方面深化以避免技术炫技但缺乏市场需求的问题[16] - 当前具身智能机器人多应用于长跑、基础服务等简单场景,这些场景并非不可替代,且因成本高昂(如灵犀X2定价令中小企业却步)可能导致用户亏损[17] - 行业被资本类比为下一个新能源汽车,但盈利不能依赖表演性功能,需聚焦核心场景如工业制造,切实降低成本、提升稳定性[19]
15.5亿元产业基金成立,深创投加码AI与具身智能
南方都市报· 2025-10-09 11:42
基金设立与出资结构 - 深圳市深创投人工智能和具身机器人产业私募股权投资基金合伙企业正式成立,出资额为15.5亿元人民币 [1] - 基金由深圳市引导基金投资有限公司、深圳市福田红土股权投资基金管理有限公司、深圳市红土创业投资有限公司、深圳市汇通金控基金投资有限公司共同出资,呈现“政府引导+市场化运作”特色 [1] 深创投的战略布局与投资逻辑 - 深创投累计管理资产规模超过5100亿元,投资企业超过1700家,此次设立基金意味着公司将AI与具身机器人领域列为重点战略方向 [2] - 公司在人形机器人领域累计投资项目约40个,涵盖从核心零部件到整机厂商的全产业链,重点投资企业包括优必选、宇树科技等9家企业 [2] - 投资逻辑清晰系统:上游支持关键零部件和传感器技术突破,中游助力整机和平台企业发展,下游推动AI+机器人应用场景落地,形成“全链条投资”的生态闭环 [2] - 在AI终端侧投资荣耀终端,在算法侧支持云天励飞等独角兽,形成“硬件+算法+应用”的系统性布局 [3] - 凭借“国资背景、市场化运作”机制,公司精准对接国家战略,坚持投早、投小、投硬科技,为前沿创新企业提供长期资金支持 [3] 深圳市AI与机器人产业发展现状 - 2024年深圳市AI产业规模达到3685亿元,拥有典型企业2887家 [4] - 深圳市机器人产业链总产值突破2000亿元,企业总量达7.4万家,形成以华为、腾讯为龙头,比亚迪、大疆为支撑,优必选、云天励飞等为中坚的“雁阵梯队” [4] - 2024年深圳机器人产业发生72起融资事件,占全国近四分之一,其中早期融资比例较高 [6] 深圳市政策支持与发展目标 - 深圳市发布《具身智能机器人技术创新与产业发展行动计划(2025-2027年)》,提出到2027年培育10家以上百亿级企业,产业规模突破千亿元 [4] - 《人工智能先锋城市行动计划(2025—2026年)》设定,到2026年AI企业突破3000家,独角兽企业超过10家,推动百款以上AI终端进入市场,打造万亿元级AI终端产业 [4] - 政策强化企业创新主体地位,引导资本投早、投小、投硬科技,攻克大模型、零部件等“卡脖子”技术 [4] 企业创新与市场应用进展 - 优必选科研级机器人“天工行者”已获百台意向订单 [5] - 乐聚推出全球首款5G-A人形机器人“夸父”,探索与新一代通信技术融合 [5] - 越疆的仿生六足机器人在复杂地形展现稳定性 [5] - 元象信息凭借国内最大规模MoE大模型,在VR和文化数字化领域实现突破 [5] - 资本与政策形成合力,推动“技术突破—产业落地—资本循环”的闭环加速形成 [6]
盘点下国内外那些做具身感知的公司们!
具身智能之心· 2025-10-08 10:49
文章核心观点 - 具身智能已成为全球新焦点 打造通用本体和大脑是创业公司、资本和产业界高度关注的突破方向[2] - 文章旨在全面梳理具身大脑领域国内外知名公司 分析其技术特点、产品布局和应用场景 为行业提供全景图[2] - 重点关注开发机器人"大脑"系统的企业 包括具身大模型、多模态感知决策系统等[3] 国内公司分析 自变量机器人 - 公司成立于2023年 聚焦"通用具身大模型"研发 以真实世界数据为主要来源构建具备精细操作能力的通用机器人[6] - 技术路线偏向"大脑" 坚持走端到端的具身通用大模型路线 成立不到两年已完成8轮融资[6] - 代表成果包括2024年10月推出的WALL-A模型 为全球目前最大参数规模的具身智能通用操作大模型Great Wall系列成员 能整合视觉、语言与运动控制信号实现感知到执行完整闭环[6] - 另一成果为开源具身智能基础模型Wall-OSS 具备强大泛化性和推理能力[6] 星海图 - 公司于2023年9月成立 专注于提供智能导航等大脑相关技术方案 坚持"一脑多形"理念[6] - 通过构建环境地图、路径规划等功能 为机器人在复杂环境中自主行动提供支持[6] - 代表成果为具身基础模型EFM-1 采用"快-慢双系统"模型架构 实现从感知理解到控制的闭环决策[6] 优必选 - 公司成立于2012年 是全球人形机器人商业化领导者 拥有全栈自研能力包括运动控制、关节模组、AI-Embodied系统等[10] - 作为国内人形机器人领域标杆企业 已在全球市场建立广泛品牌影响力和市场份额[10] - 代表成果为2025年自主研发的百亿参数基座多模态大模型Thinker 在机器人感知与规划领域三大国际权威基准测试中斩获四项全球第一[10] - 技术成果包括3D扩散策略DP3 仅需10次人类演示即可让机器人学会复杂操作任务 真实场景成功率高达85%[10] - 空间智能引擎RSR为全球首个real2sim2real引擎 实现低成本三维环境重建与仿真训练[10] 智元机器人 - 公司成立于2023年2月 聚焦AI与机器人深度融合 致力于打造世界级领先的通用具身智能机器人产品及应用生态[10] - 代表成果为2025年3月发布的智元启元大模型 基于Vision-Language-Latent-Action架构 融合多模态大模型与混合专家技术[10] - 该模型具有小样本快速泛化能力 任务成功率较市面模型提升32% 支持"一脑多形"的跨本体应用[10] - "具身智脑"分层系统包括云端超脑、大脑、小脑、脑干等部分 形成完整控制体系[10] 银河通用 - 公司成立于2023年5月 为核心技术与产品构建了三大技术壁垒 在合成数据驱动的多模态大模型方面自主研发全球首个"通用具身大模型"[10] - 采用"大脑+小脑"协同框架[10] - 代表成果包括全球首个端到端具身抓取基础大模型GraspVLA 展示无需大规模真实数据、仅通过合成数据达到基础模型预训练的能力[14] - GroceryVLA模型为首款面向零售商业化的端到端大模型 支持复杂零售场景下的精准商品识别与取送[14] - TrackVLA为产品级纯视觉端到端导航大模型 支持自然语言指令驱动 具备零样本泛化能力[14] 千寻智能 - 公司成立于2024年 为国内领先的AI+机器人全栈生产力级技术能力的具身智能公司 团队成员来自顶尖高校和知名企业[14] - 代表成果为Spirit V1 VLA模型 是国内首个攻克柔性物体长程操作难题的AI模型 通过视觉-语言-动作融合实现自然语言指令驱动的复杂任务[14] 星动纪元 - 公司由清华大学交叉信息研究院孵化 研发具身智能以及通用人形机器人技术和产品 聚焦通用人工智能前沿应用[14] - 代表成果为端到端原生机器人大模型ERA-42 是国内首个端到端原生具身大模型 支持机器人完成超过100种动态任务[14] - 该模型通过视频训练快速学习技能 降低数据采集成本 实现跨任务、跨本体迁移[14] 逐际动力 - 公司聚焦具身智能机器人研发与制造 围绕本体硬件设计制造、基于强化学习的全身运动控制、具身大脑训练范式三大核心技术构建具身Agent开发工具链[14] - 代表成果包括LimX VGM具身智能操作算法 利用视频生成技术推动具身大脑突破[14] - LimX DreamActor为全新具身智能训练范式 首次实现Real2Sim2Real、模仿学习和真机强化学习的深度结合[15] 穹彻智能 - 公司聚焦"以力为中心"的具身智能大模型和相关基础设施研发 为不同行业提供通用机器人智能解决方案[18] - 穹彻具身大脑结合先进算法和数据支持 具备指令推理、任务规划、物体分类、环境感知、自主导航等全闭环能力[18] - 代表成果穹彻具身大脑由实体世界大模型和机器人行为大模型组成 Noematrix Brain 2.0新增实体概念学习能力 支持3D模仿学习框架和视-触觉融合网络[18] 智源研究院 - 成立于2018年11月 核心目标是聚焦人工智能原始创新和核心技术 推动人工智能理论、方法、工具、系统和应用取得变革性、颠覆性突破[18] - 代表成果RoboBrain 2.0是新一代具身视觉-语言基础模型 以70亿和320亿参数的两种规格实现感知、推理与规划能力统一[18] 国外公司分析 Figure AI - 公司成立于2022年 总部位于美国硅谷 致力于开发具备人工智能能力的人形机器人以解决劳动力短缺、危险工作环境和老龄化社会等问题[21] - 代表成果Helix为通用视觉-语言-动作模型 采用独特"双系统"AI架构模仿人类"直觉"和"思考"的认知模式[21] Physical Intelligence - 公司成立于2023年1月 为美国具身大脑初创公司 专注于开发能为各类机器人和机器添加高级智能的软件[24] - 目标创建通用机器人系统的人工智能 将用于构建语言模型的技术与控制和指导机器的技术相结合[24] - 代表成果包括2024年10月31日发布的首个机器人通用基础模型π0 以及近期新开源的π0.5模型 后者采用"知识隔离"训练方法提升开放世界场景泛化能力[24] 谷歌DeepMind - 由DeepMind和Google Brain于2023年合并而成 聚焦通用人工智能研究 致力于开发能理解和适应物理世界的智能系统[24] - 代表成果Gemini Robotics基于Gemini 2.0的视觉-语言-动作模型 可直接控制机器人执行复杂任务 具备通用性、交互性和灵巧性[24] - Gemini Robotics-ER专注于具身推理 Project Astra为概念AI助理 集成Gemini技术通过摄像头和传感器理解物理环境[24] 英伟达 - 全球领先图形处理器设计公司 已发展为涵盖芯片设计、系统平台、软件生态、云计算服务、人工智能解决方案的全栈计算公司[24] - 代表成果Eureka系统基于GPT-4打造 可自动训练实体机器人动作指令 支持30余种复杂动作 具备零样本生成、编写代码和语境改进等能力[24] - GR00T N1开源模型采用双系统架构 包括快速反应的"系统1"和认知决策的"系统2" 实现接近人类运动控制能力[25] Skild AI - 美国领先机器人"大脑"研发企业 目标研发通用机器人操作系统 帮助机器人理解不同应用场景并驱动机器人自主实现智能精细化操作[28] - 代表成果Skild Brain通过摄像头图像和关节反馈直接控制机器人动作 采用分层架构适用于各种四足机器人、人形机器人、桌面机械臂、移动机械手等[28] Covariant - 专注于为机器人构建基础AI模型的公司 技术依赖于机器人与现实世界的交互产生的体验和反馈[28] - 代表成果RFM-1为世界上首个基于真实任务数据训练的机器人大模型 是参数80亿的transformer模型 支持任何模态输入、预测任何模态输出[28] 知名团队研究 - Meta和CMU联合打造RoboAgent 核心在于多任务动作分块Transformer架构 通过在现有机器人经验基础上创建多样化语义增强集合来倍增离线数据集[30] - Stanford李飞飞团队VoxPoser核心思想是利用VLM和LLM常识知识 借助模型生成代码将常识知识映射到三维空间供运动规划器使用 实现零样本合成日常操纵任务轨迹[30]
“擎天柱”秀中国功夫!人形机器人多场景应用 这个赛道太火了
中国证券报· 2025-10-06 07:35
特斯拉人形机器人进展 - 特斯拉CEO埃隆·马斯克发布视频展示人形机器人擎天柱具备AI驱动精准应对功夫招式的能力[2] - 擎天柱已成为特斯拉核心焦点 公司计划2025年底推出第三代机型并于2026年启动量产[2] - 马斯克预计2030年前将实现年产100万台擎天柱机器人[2] 国内人形机器人行业动态 - 人形机器人赛道自去年起成为资本市场热点 今年以来在政策资本技术驱动下迎来爆发式增长[2] - 国内企业优必选 智元机器人 宇树科技 松延动力 银河通用等已相继公布新订单与市场拓展布局[2] - 民生证券研报称宇树科技将于2025年四季度提交IPO申报材料 智元机器人入主上纬新材 乐聚机器人完成股改 头部厂商证券化进程加速[8] 机器人线下商业应用 - 国内首家机器人商店陶朱新造局在北京首钢园开业 陈列宇树科技 智元机器人等头部厂商产品及AI眼镜等智能硬件[5][6] - 该店10月1日开业以来日均客流量约1万人 陪伴机器人 AI眼镜 智能乐器受消费者欢迎[6] - 商店运营方首程控股计划未来12个月以商场店 快闪店等四种业态落地约20家门店[6] 人形机器人具体场景案例 - 银河通用人形机器人在北京颐和园实现全自主服务 完成语音接待 下单支付 商品抓取等全流程操作[7] - 智元机器人远征A2在上海科幻馆担任向导 合影伙伴 舞蹈演员等多重角色 并与机器狗共舞表演[7][8] - 智元机器人两款服务机器人在安徽淮南寿县二十四节气馆作为文化大使参与讲解与互动 应用于多个传统文化场馆[8] 券商行业观点 - 国金证券研报表示人形机器人作为新质生产力核心载体 深度融合人工智能 高端制造与新材料技术 正驱动产业变革[8] - 国金证券整体看好运动控制 材料与垂直场景应用 建议布局技术壁垒高 渗透率提升的细分龙头[8]
“擎天柱”秀中国功夫!这个赛道太火了
中国证券报· 2025-10-05 19:55
特斯拉人形机器人进展 - 特斯拉CEO埃隆·马斯克发布视频展示人形机器人擎天柱能够精准应对功夫招式并反击,并明确表示其由AI驱动而非遥控操作[1] - 特斯拉计划于2025年底推出擎天柱第三代机型,并于2026年启动量产,预计2030年前实现年产100万台的目标[1] - 自去年起人形机器人已成为特斯拉的核心焦点,其技术与产业化进展备受市场关注[1] 国内市场发展与商业化 - 今年以来在政策、资本和技术驱动下,国内人形机器人行业迎来爆发式增长,优必选、智元机器人、宇树科技、松延动力、银河通用等企业相继公布新订单与市场拓展布局[1] - 国内首家机器人主题商店陶朱新造局在北京开业,陈列宇树科技、智元机器人、松延动力等头部厂商产品,日均客流量约1万人,陪伴机器人、AI眼镜、智能乐器受欢迎[3] - 该机器人商店未来将以商场店、快闪店、文旅店、景区展厅店四种业态布局,预计未来12个月落地约20家门店,近期成都快闪店及首都机场T3、T2店将开业[3] 多场景实际应用案例 - 银河通用的人形机器人在北京颐和园实现全自主服务,具备语音接待、下单支付、商品抓取与取送等全流程操作能力,并在中关村大融城、北京市十一学校落地[4][6] - 智元机器人的远征A2交互服务机器人身高169厘米、体重69公斤,在上海科幻馆担任向导、合影伙伴、舞蹈演员等多重角色,并与机器狗进行共舞表演[6] - 智元机器人的远征A2与灵犀X2在安徽淮南寿县二十四节气馆作为文化大使参与文化讲解与沉浸式互动,并在惠州、湖南怀化、苏州等多地场馆落地应用[8][9] 行业证券化与投资前景 - 民生证券研报指出宇树科技将于2025年四季度提交IPO申报材料,智元机器人入主上纬新材,乐聚机器人完成股改,头部国产人形主机厂证券化进程加速[9] - 国金证券研报认为人形机器人作为新质生产力核心载体,深度融合人工智能、高端制造与新材料技术,驱动产业变革,整体看好运动控制、材料与垂直场景应用[9]
机器人“狂踹不倒”视频刷屏!太空舱遍布城市街巷,银河通用这几手秀麻了
量子位· 2025-10-02 10:12
核心技术:Any2Track框架 - 银河通用推出的Any2Track是一个全新的通用动作追踪框架,能让机器人精确模仿各种人类复杂动作,并实时适应真实世界的干扰[2] - 该框架采用二阶段强化学习设计,兼顾精准的动作模仿与抗干扰能力,一举超越了ASAP、GMT等传统方法,实现了零样本sim2real[7][8] - 框架包含AnyTracker通用动作追踪模块和AnyAdapter在线适应模块,通过解耦学习过程实现了丰富的运动表现力和强大的动力学适应性[10][17][28] 技术实现细节 - AnyTracker模块通过标准化动作空间和动作聚类、专家到通用等方法,解决了高自由度人形机器人动作空间复杂、单次优化难以学习所有动作分布的瓶颈[14][15][16] - AnyAdapter模块利用历史交互数据学习环境动力学特征,通过动力学感知的世界模型预测和adapter架构微调,动态调整机器人行为,实现在线动力学适应性[18][20][26][27] - 训练中使用AMASS和LAFAN1运动数据集的组合作为训练数据,在特征提取时采用包含100个状态-动作对的窗口进行自回归预测[14][21][23] 性能测试结果 - 在动作追踪质量测试中,AnyTracker的成功率(SR)达到89.23%,明显优于OmniH2O(75.64%)和Exbody2(79.68%)等基线方法[30] - 在抗干扰测试中,Any2Track在所有条件下均超越基线方法,无干扰时SR为89.8%,地形变化时SR为83.2%,外力作用时SR为59.0%,物理属性变化时SR为80.6%[32] - 在宇树G1机器人实际部署测试中,Any2Track在复杂地形下的MPJPE指标为18.34,较PPO的37.21改善18.87;在负重场景下MPJPE为23.24,较PPO的37.52改善14.28[36] 商业应用与落地 - 银河通用已构建GraspVLA、TrackVLA、GroceryVLA等端到端具身大模型,在精准操作、导航等核心任务上实现泛化能力突破[38] - 公司通过"银河太空舱"将机器人技术推向商业场景,目前已在北京、上海、深圳、成都、杭州等全国多地部署,应用于零售、文旅等领域[44][48][49] - 在颐和园、中国网球公开赛、苏超联赛等场景中,银河太空舱已成功落地,为游客和赛事提供机器人服务[46][48][49] 公司技术战略 - 银河通用形成了从合成数据到多模态具身大模型训练的完整技术管线,采用"合成为主、真实为辅"的数据范式解决行业数据稀缺难题[52][54] - 公司通过打造真实场景训练平台,结合大规模合成数据与基座大模型,加速人形机器人在垂直场景的工作能力培养[55][57] - 采用"合成+真实、研发+场景"的双轮驱动战略,推动具身智能在工业、零售、文旅、医疗等多元场景的规模化落地[58]