Workflow
Robotics
icon
搜索文档
“具身智能”成国家未来重点培育产业 训练师岗位成“全人才梯度吸纳场”
央视网· 2025-06-21 16:09
央视网消息:今年3月,"具身智能"首次被写入两会政府工作报告,成为国家未来重点培育产业,其中,人形机器人是具身智 能的典型代表。近年来,人形机器人越来越灵活,应用场景也越来越广泛。产业升级发展的背后离不开一个新职业——具身智能 训练师。他们是如何让机器人变得越来越"能干"呢?一起去上海的一家人形机器人训练场看一看。 采集到的视频数据,还要转化为机器人能"看得懂"的精确数据,这就来到了机器人训练的第二步,数据审核。具身智能训练 师宋子文的工作是进行机器人数据审核,他每天要审核上百条数据,不到一年时间,他和小伙伴们就审核了400多万条的真机数 据。 身着动作捕捉设备,手把手教授机器人的这位"动作老师",是朱绵锐。 他正在进行的工作是采集数据,这也是机器人训练的 第一步。根据任务难易程度,一个采集师每天会产出50-200条数据。 宋子文口中提到的算法同事就是杨树开。现在他正在机器人上测试模型的表现,这个模型正是昨天他收到数据后,用算法训 练而来。 数据采集岗的几个小伙儿来自湖北,是计算机专业的应届毕业生。 具身智能训练师并非某一个人,想要完成机器人的训练,要3个主要岗位共同配合。 已经具备基础擦桌子能力的机器人,想 ...
星动纪元推出超拟人服务机器人星动Q5,已签订超百单意向订单
IPO早知道· 2025-06-21 09:52
公司背景 - 星动纪元是唯一一家清华大学占股的人形机器人企业,由清华大学交叉信息研究院孵化,成立于2023年8月 [2] - 公司已与海尔智家、世纪金源、天悦酒店等来自制造、连锁零售、连锁酒店、文旅、养老医疗等业务的企业达成战略签约,意向订单超百单 [2] 产品创新 - 星动纪元推出超拟人服务机器人星动Q5,采用曼妙"小蛮腰"设计,被业内戏称为机器人界"小腰精" [2] - 产品全身44个高自由度,能实现扭腰、握手、摆臂、转头等接近人类肢体的动作 [4] - 搭载仿生7轴高精度机械臂及11自由度"精灵手",每秒完成10次点击动作,单手可拿起10kg重物 [4] - 腿部3个自由度可灵活弯曲升降,能完成拎包、端盘、送水、搬运、叠被子、按电梯等基础工作 [4] 技术优势 - 采用拟人化语音引擎+大模型技术,支持37种以上语言指令精准理解 [4] - 超紧凑型底盘(尺寸582mm×519mm×225mm)+激光雷达+视觉融合导航,实现自主规划路线和狭窄通道避障 [5] - 搭载自研具身模型ERA-42,能通过全身遥操作利用人类数据,降低数据获取成本,提高学习效率 [5] - 构建"全身遥操作+数据采集+模型迭代"闭环,支持数据手套、VR设备精准同步 [5] 应用场景 - 可应用于商业场景(导购陪购、服务员端盘)、酒店场景(按电梯、擦鞋)、医疗养老场景(送水、递物)等 [7] - 能在商场、店铺等场景中灵活切换导购员、服务员、接待员等角色 [7] 行业影响 - 星动Q5的发布标志着服务机器人行业正式迈入"交互体验升级"新阶段 [2] - 产品从拼"功能"迈入卷"体验"时代,打破传统机器人"交互弱+场景单一"等应用问题 [3][7]
SoftBank pitches chip giant TSMC on building $1 trillion AI hub in US: report
New York Post· 2025-06-21 06:29
项目概述 - 软银CEO孙正义正推动台积电在美国亚利桑那州投资1万亿美元建设巨型机器人及人工智能综合体[1] - 该项目代号为"Project Crystal Land",旨在推动人工智能发展并巩固孙正义的行业影响力[4] - 综合体设计参考中国深圳的生产中心模式,可能促进制造业回流美国[1] 合作与投资 - 软银寻求台积电作为合作伙伴并投资1650亿美元,台积电已在亚利桑那州建立首家工厂[3] - 同时接触韩国三星等科技巨头作为潜在投资者[5] - 软银与OpenAI共同筹资400亿美元用于美国大型数据中心建设[7] 政府关系与支持 - 项目需要特朗普政府支持,已与美国商务部长等官员讨论税收优惠事宜[4][5] - 符合特朗普推动制造业回流的政策方向,特别是针对科技公司和汽车制造商[2][11] 融资与实施 - 软银探索项目融资方式,包括为5000亿美元的Stargate数据中心计划采用分阶段融资[10] - 可能采用相同融资模式推进Project Crystal Land项目[10] - 已列出潜在参与企业名单,包括自动化公司Agile Robots SE[8] 行业影响 - 人工智能产业需要大量电力和存储能力,该项目将强化相关基础设施[7] - 台积电作为英伟达先进芯片制造商,其参与程度尚不明确[3] - 项目进度可能反映软银与OpenAI的筹资速度不及预期[8]
4 Top Robotics Stocks to Watch in the Second Half of 2025
ZACKS· 2025-06-20 23:40
行业概览 - 机器人行业在2025年下半年迎来重要拐点 革命性AI整合为各领域创造转型机遇 主要参与者包括AMD 特斯拉 Cadence Design Systems和Serve Robotics [2] - 全球机器人市场预计以15.1%年增长率扩张 2032年估值将达到1698亿美元 [2] - 工业机器人市场2030年估值预计达1627亿美元 较2024年871亿美元增长11%年复合增长率 主要驱动力为制造业自动化普及和技术进步 [3] 细分领域 - 医疗机器人领域2030年规模预计达5190万美元 约翰霍普金斯和斯坦福研究成果显示机器人可通过视频观察模仿外科手术 [4] - 协作机器人(cobots)2025-2045年销量预计增长6100% 食品饮料包装应用增长尤为显著 [5] - 国防和太空探索领域 Palantir Anduril和AeroVironment获得自主系统重大合同 SpaceX火箭捕捉机械臂和NASA智能火星车展示太空探索能力 [6] 重点公司 AMD - 2025年建立完整机器人产品组合 采用自适应SoC和FPGA解决方案支持工业自动化和协作机器人 [9] - Kria SOM平台实现高吞吐量AI传感器数据处理 嵌入式CPU支持数字孪生实时仿真 [9] - Versal和Zynq SoC为机械臂提供确定性控制 与ABB合作技术集成于GoFa协作机器人 [10] 特斯拉 - Optimus人形机器人2025年计划量产数千台 2026年目标5-10万台 旨在解决全球劳动力短缺 [11] - 计划2026年底通过SpaceX星舰将Optimus送往火星 展示跨公司技术整合能力 [12] - 垂直整合AI 制造专业知识和自主系统 布局20万亿美元机器人和自主移动市场 [12] Cadence Design Systems - Tensilica Vision和AI处理器IP支持机器人应用 如Kneron KL720 SoC专注于机器人和工业控制 [13] - Reality数字孪生平台结合AI和物理仿真优化机器人系统设计 Neo NPU IP提供80 TOPS边缘AI处理性能 [13] Serve Robotics - 2021年从Uber分拆后完成数万次配送 与Uber Eats和7-Eleven合作 获得部署2000台机器人的多年合同 [14] - Gen3机器人具备L4级自主导航能力 速度提升60%达11mph 电池续航增加67% 2025年计划扩展至迈阿密 亚特兰大和达拉斯市场 [15]
晚点独家丨宇树 C 轮落定,中移动、腾讯、锦秋、阿里、蚂蚁、吉利共同领投,估值超 100 亿
晚点LatePost· 2025-06-20 21:20
融资与估值 - 公司近期完成C轮融资,由中国移动旗下基金、腾讯、锦秋、阿里、蚂蚁和吉利资本共同领投,大部分老股东跟投,投前估值超过100亿元人民币[3][4] - 今年1月初主要潜在投资方计划出资1亿-3亿元不等,2月后C轮投后估值逐渐上涨,融资结构相应变化[4] - 部分老股交易的估值已超过150亿元人民币,有潜在产业投资方购买老股[5][7] 市场地位与产品 - 公司的机器狗和人形机器人在知名度、影响力和实际出货量方面位居中国乃至世界前列[7] - 机器狗面向消费市场和巡检等生产、物流场景,人形机器人主要客户为全球具身研究机构[7] - 产品成为机器人博士生做研究、写论文的“生产资料”,在硅谷周边高校实验室广泛使用[7] 未来发展 - 公司强于硬件和运动控制,未来需突破机器人大脑和具身基础模型技术以拓展生产、生活服务场景[7] - 5月底完成股改,公司名称变更为杭州宇树科技股份有限公司,市场推测将启动IPO流程[8]
人形机器人“闹展会”,量产易、应用难
36氪· 2025-06-20 20:15
行业动态 - 2025年世界移动通信大会(MWC25上海)成为人形机器人集中展示平台,智元、傅利叶、宇树、乐聚等公司产品同台竞技,展示运动、交互、作业等智能能力[1] - 2025世界机器人大赛首次亮相展会,通过编程对抗赛培养青少年科技人才,推动具身智能产业变革[1] - 人形机器人行业进入"拟人"向"类人"过渡阶段,需突破安全、情感、伦理、交互等关键技术难题才能实现"超人"愿景[8] 技术架构 - 智元机器人采用"本体-小脑-大脑"三层架构:本体和小脑实现断网基础操作,大脑通过云平台+具身算法实现复杂任务处理[4] - 通信技术为人形机器人提供实时信息获取能力,RAG技术构建的业务知识库使远征A2能胜任营业厅导览、营销等服务工作[4] - 世界大模型成为行业突破关键,需通过4S店销售等细分场景认知逐步构建物理世界理解能力[6][8] 应用场景 - 智元远征A2、精灵G1等产品已部署在通信行业展厅、营业厅、机房场景,提供导览、巡检、动环监测等服务[4][5] - 精灵G1可替代人工完成机房24小时巡检,具备资产盘点、应急操作等功能[5] - 5G-A/6G与边缘算力为人形机器人提供基础设施,其在养老陪护、高危作业等场景的需求将反向推动网络与AI技术革新[5] 行业挑战 - 当前行业尚无企业能整合OpenAI的精准控制、特斯拉的训练能力、Physical Intelligence的通用化大脑等四项核心技术[8] - 人形机器人在国际技能大赛中展现料箱搬运、衣物整理等能力,但实时感知与决策仍依赖人工遥控[11] - 北京已形成人形机器人全产业链体系,武汉预计2025年Q3实现量产,成都开展教育、安防等场景实景验证[12] 产品进展 - 智元灵犀X2展示太极拳和"内心戏"对话功能,远征A2具备毛笔书写和多轮语音对话能力[2][4] - 宇树科技参与机甲格斗赛,其动态平衡算法使机器人摔倒后数秒内自主站立[11] - 傅利叶机器人实现观众互动功能,开普勒等企业参与工业场景技能比拼[1][11]
突破开放世界移动操作!首个室内移动抓取多模态智能体亮相,微调模型真实环境零样本动作准确率达 90%
机器之心· 2025-06-20 19:59
核心观点 - 上海人工智能实验室联合多所高校研究团队提出首个专为开放世界移动操作(OWMM)设计的多模态智能体架构OWMM-Agent,首次实现全局场景理解、机器人状态跟踪和多模态动作生成的统一建模 [1] - OWMM-Agent在真实环境测试中零样本单步动作预测准确率达90%,展现出强大的泛化能力 [2][12] - 该研究通过仿真数据合成方案微调多模态大模型OWMM-VLM,在模拟环境和真实环境中均取得突破性进展 [8][9][12] 问题背景 - 传统移动抓取机器人在处理开放指令时依赖预先构建的场景3D重建或语义地图,耗时且难以应对动态环境 [5] - OWMM任务面临三大核心难点:全局场景推理、具身决策闭环和系统整合问题 [5] 技术方案 多模态Agent架构 - 将OWMM问题建模成多轮多图推理和定位问题,实现端到端的感知-推理-决策-状态更新过程 [6] - 通过函数调用传统路径规划器和机械臂运动规划器,不依赖预定义策略技能库 [8] 数据合成方案 - 基于Habitat仿真平台设计数据合成方案,解决VLM基座模型在机器人领域的"幻觉"问题 [8] - 利用143个仿真场景、157种可抓取物体和1471个容器,采集20万+条多图加文本数据集 [9] - 通过GPT-4o重写思维链和文字总结内容,引入机器人第一视角图像增强数据多样性 [9] 模型表现 模拟环境测试 - OWMM-VLM-38B模型在单步动作决策、图像检索和动作定位三项任务上准确率分别达97.85%、87.54%和88%,远超GPT-4o和模块化方案 [15] - 在308次模拟测试中,OWMM-VLM-38B完成长序移动抓取任务成功率达21.9%,且零死循环,而基线模型成功率低于1%且频繁陷入死循环 [15] 真实环境测试 - 在Fetch机器人上仅通过模拟数据训练即实现90%的零样本动作生成成功率(30次测试中27次成功) [12] - 在"将豆奶盒从书桌移至会议桌"任务中展现出强泛化能力,能准确检索目标位置、规划导航路径并生成机械臂抓取坐标 [12] 未来展望 - 该研究首次证明通过大规模模拟数据微调的VLM模型可成为开放世界移动操作的通用基础模型 [14] - 为"会听、会看、会做"的通用家庭助手奠定关键技术基础,有望实现"一句话指挥机器人完成家务"的智能生活 [15]
具身智能: 变成现实后是“变现”
36氪· 2025-06-20 19:19
行业动态 - 2025年被视为具身智能机器人的"量产元年",产业活动展示翻跟头机器狗、倒水机器人等产品已成为常态[1] - 2025年具身智能机器人场景应用生态论坛评出22家"技术先锋奖"和16家"场景拓展先锋奖",获奖企业覆盖电机、视觉传感器、相机等零部件及各类机器人产品[1] - 北京亦庄宣布将开设具身智能机器人4S店,提供销售、零配件供应、售后服务等一体化服务[3] - 行业面临的核心问题是需求定位和目标客户群体确定[3] 逐际动力 - TRON1多形态双足机器人具备行走、跳跃、上下楼梯、"踢不倒"等能力,采用模块化足端设计可随时更换[3][5] - TRON1机器人主要解决移动问题,可搭载机械臂、语音交互套件等,面向研究机构、友商和发烧友销售[7] - 公司2023年底发布首代人形机器人,计划发布新一代全尺寸人形机器人,能完成高动态拟人化动作[9] - 2022年成立后快速获得融资,2023年完成2亿元Pre-A轮,2024-2025年完成5亿元A轮系列融资,投资方包括阿里巴巴、蔚来资本等[10] - 已获评深圳市专精特新中小企业称号[10] 灵巧智能 - 展示四款"手部"产品及DexCap数据采集系统,DexHand021量产版能完成32项人手功能动作,单指负载1千克[10] - 新产品021Pro可复现"翻腕倒水"等复杂动作,适应非结构化环境并实现全域感知[10] - 完成"侵入式脑机接口+义肢"案例,拓展至残障辅助、养老等领域[11] - DexHand021S三指产品自重仅0.62kg,价格千元级,面向教育、服务业和工农业应用[14] - 2024年1月成立后1年内完成研发、量产、入市,高管团队来自知名企业和一流高校[16] - 与上市企业捷昌驱动建立股东和生产合作关系[16] 具身科技 - 机器狗"灵瞳"已应用于成都警队日常巡逻和反诈宣传,灵瞳Plus参与治安巡逻,速度达17千米/小时[16] - 与成都公安局高新区分局合作成立"警用仿生机器人实验室"[16] - 人形机器人天行者1号核心零部件本地化率超90%,研发周期69天,主要面向工业标准化环境应用[18] - 2025年5月完成数千万元天使轮融资,成立不足1年估值达数亿元[21] - 核心团队来自电子科技大学机器人研究中心,产品还应用于应急、消防、文旅等领域[21] - 计划年末发布情感机器人"爱湫EMO1",与天府绛溪实验室共建研究中心探索脑机接口融合[23] 行业趋势 - 行业呈现多元化发展路径:从核心部件突破到整机集成,从B端专业市场到G端场景应用,尝试触达C端消费者[23] - 技术迭代加速、成本持续下探与应用场景不断扩展,推动具身智能机器人从实验室走向实际应用场景[23]
“全市场唯一百亿规模”机器人ETF(562500)连续四日获资金加码,宇树C轮融资落定,估值近百亿
每日经济新闻· 2025-06-20 14:32
机器人ETF表现 - 机器人ETF(562500)现跌1.84%,持仓股中伟创电气跌6.6%领跌,拓斯达跌6.54%,柏楚电子跌6.06% [1] - 机器人ETF盘中成交金额超4.6亿元,6月以来日均成交额4.91亿元,居可比基金首位 [1] - 机器人ETF最新资金净流入9870万元,连续四日净流入1.55亿元,居可比基金首位 [1] - 机器人ETF最新规模130.69亿元,年内增长89.32亿元,新增规模居可比基金首位 [1] - 机器人ETF最新份额160.27亿份,年内增长107.04亿份,新增份额居可比基金首位 [1] 机器人行业动态 - 宇树科技完成C轮融资,投前估值超100亿元人民币,由中国移动旗下基金、腾讯、阿里等领投 [1] - 2025年全球人形机器人市场规模预计达53亿美元,中国市场规模预计达53亿元 [2] - 人形机器人将在更多场景实现商业化应用,提升生产效率并在教育、家庭生活中扮演更积极角色 [2] 机器人ETF产品特点 - 机器人ETF(562500)是全市场唯一规模超百亿的机器人主题ETF [2] - 成分股覆盖人形机器人、工业机器人、服务机器人等多个细分领域 [2] - 帮助投资者一键布局机器人上中下游产业链 [2]
技术干货:VLA(视觉-语言-动作)模型详细解读(含主流玩家梳理)
Robot猎场备忘录· 2025-06-20 12:23
具身智能与VLA模型技术发展 核心观点 - VLA模型(视觉-语言-动作模型)是整合视觉、语言和动作的多模态模型,推动机器人从"看得见"、"听得懂"迈向"动得准"的新阶段 [1] - 2022年Google和CMU的"SayCan"、"Instruct2Act"工作首次实现Transformer模型同时处理视觉、语言和动作轨迹生成,2023年谷歌DeepMind的RT-2模型进一步实现端到端动作生成 [1] - VLA模型被视为端到端大模型2.0,其核心优势在于拟人化推理与全局理解能力,显著缩短指令理解与任务执行的距离 [2][3] 技术框架与特性 - **核心组件**:视觉编码器(提取图像特征)、文本编码器(处理指令)、动作解码器(输出10-30秒动作路径) [2] - **四大特性**: 1 架构继承(仅新增动作输出模块) 2 动作token化(将动作转化为语言形式表示) 3 端到端学习(感知-推理-控制一体化) 4 可泛化性(预训练VLM支持跨任务迁移) [4] 行业应用与挑战 - **商业化进展**:2025年起多家公司发布自研VLA模型,双系统架构(分离VLM与动作执行模型)成为主流技术路径 [5][6] - **数据瓶颈**:训练需大规模多模态同步数据,但硬件商用不足导致数据采集成本高,依赖专家数据集限制复杂任务表现(如RT-2难以处理"准备早餐"等多步骤任务) [7] - **技术缺陷**:缺乏长期规划能力,VLM(大脑)与动作模型(小脑)连接依赖语言指令直接映射,时序处理不足导致长流程任务中易出现步骤遗漏或逻辑混乱 [7] 行业生态与趋势 - **主流玩家分类**:涉及五类企业,技术方案涵盖双架构VLA模型等5大类方向 [5] - **赛道热点**:车企、产业链公司及智驾从业者加速涌入,技术路线聚焦"大脑优先"与"运动优先"之争 [5] - **落地场景**:需突破灵巧手等执行端技术(被称为机器人"最后一厘米"),解决商业化卡点 [5]