通用机器人

搜索文档
机器人跑马拉松,到底在比什么?
AI科技大本营· 2025-04-21 18:24
赛事概况 - 全球首个"人机共跑"半程马拉松在北京亦庄举办,引发科技圈和大众关注 [1] - 赛事涵盖21.0975公里复杂地形赛道,包括6个左转道和8个右转道,转弯角度≥90° [6] - 18款国产机器人参赛,包括天工Ultra、乐聚夸父、松延N2等来自清华大学、乐聚机器人、北京人形机器人创新中心等机构的机型 [6] 冠军机器人天工Ultra - 身高1.8米,体重55公斤,采用"具身大小脑高效协同"控制架构,实现局部电机动作控制和全身动态平衡与路径规划的高效协作 [3] - 采用大功率一体化关节和低惯量腿部结构,具备爆发性速度,轻量化设计和散热技术保障持续奔跑 [5] - 完赛时间2小时40分24秒,比赛过程中更换3次电池 [6] 亚军机器人松延N2 - 身高1.2米,体重30公斤,拥有18个自由度,关节扭矩达150N·m以上 [7] - 采用强化学习与动力学模型融合的运动控制策略,核心动态平衡算法每秒计算数千次,时速10公里时重心偏移控制在3厘米内 [9] - 依赖多模态传感器融合实现复杂地形导航,即使头部感知系统失效也能自主完赛 [9] 技术挑战与行业瓶颈 - 数据瓶颈:真实数据采集线性增长无法满足模型训练指数级性能提升需求 [13] - 计算瓶颈:有限算力资源下需实现更高效智能算法 [14] - 模型架构:现有架构在效率、精度和泛化能力方面存在局限性,需探索分层决策模型等新架构 [15] 赛事意义 - 标志着具身智能迈入全新发展阶段,是对机器人运动控制、环境感知、续航能力的全面考验 [6] - 单台机器人完赛需完成约25万次关节动作,展现当前机器人技术水平的综合能力 [6][11]
大厂竞相押注人形机器人,我们距离通用还有多远?
AI科技大本营· 2025-03-27 10:23
具身智能行业动态 - 特斯拉Optimus、宇树Unitree H1、智元灵犀X2等产品通过舞蹈、骑自行车等场景展示现实世界适应能力,人形机器人成为具身智能的焦点形态 [1] - 英伟达CEO黄仁勋认为通用人形机器人技术最具实用性,并宣布"通用机器人时代已经到来",特斯拉CEO马斯克预测全球需要300亿台人形机器人 [2] - OpenAI、苹果、Meta、华为、比亚迪、小米、小鹏、vivo等科技公司纷纷布局机器人赛道 [2] 人形机器人技术优势 - 人形机器人契合人类社会的环境需求,建筑、工具、交互方式等基础设施都围绕人类身体设计 [2] - 从适配性角度看,人形机器人具有天然优势 [2] - 具身智能核心在于智能决策与物理世界的深度融合 [2] 技术挑战与发展方向 - 机器人需要具备自主移动、语音交互和环境适应等能力,不能仅停留在"炫技"阶段 [2] - 关键技术瓶颈包括:能否走入千行百业和千家万户、是否完全依赖AI大模型、通用机器人实现路径等 [2] - 专家将探讨数据瓶颈、计算瓶颈、模型架构等具身智能痛点问题 [3][7] 行业活动与专家阵容 - CSDN《万有引力》栏目邀请北京邮电大学陈光副教授、深圳市人工智能与机器人研究院夏轩副研究员、Roboraction.AI CEO黄浴进行专题讨论 [2][9][10][11] - 讨论主题包括:具身多模态大模型发展路径、最快落地应用场景、人形机器人开发重点等 [3][8] - 栏目定位为面向开发者的技术事件解读平台,将通过多种形式持续输出内容 [12][13]
美国机器人“四小龙”:通用机器人仍需十年,专用机器人即将出现,机器人的扩展法则会在五年内被探索出来 | GTC 2025
AI科技大本营· 2025-03-26 18:20
人形机器人行业现状 - 全球人形机器人领域已形成以美国公司为主导的竞争格局,主要参与者包括特斯拉、Google、NVIDIA等科技巨头以及Figure、Agility Robotics等新兴企业 [5] - 行业融资规模差异显著:Figure以26亿美元融资领跑,Physical Intelligence和Skild AI分别获得24亿和15亿美元,Agility Robotics和波士顿动力融资规模在10-12亿美元区间 [5] - 日本企业Telexistence和加拿大公司Sanctuary AI分别获得5.3亿和4亿美元融资,显示全球资本在该领域的广泛布局 [5] - 挪威公司1X Technologies和美国企业Mentee Robotics融资规模相对较小,分别为3.75亿和1.2亿美元 [5] 技术突破驱动力 - 模型层面突破:大型基础模型如ChatGPT的出现使系统具备推理能力,多模态模型显著提升对3D视觉世界的理解能力 [17] - 数据获取革新:GPU加速模拟技术可在3小时内生成相当于过去十年的训练数据,突破数据匮乏瓶颈 [17] - 硬件成本下降:人形机器人硬件价格从2001年150万美元降至当前4万美元水平,接近汽车价格区间 [17] - 模拟技术突破:物理环境模拟速度已超越真实世界时间流逝,大幅加速算法开发效率 [18] - 零部件商品化:消费电子产业推动电池、摄像头等技术发展,使机器人组件可模块化整合 [18] 技术范式转变 - 从控制理论主导转向经验学习:行业思维模式从"编程经验"转变为"通过经验学习",更贴近生物学习方式 [19] - 硬件稳健性提升:新一代机器人硬件可靠性显著增强,能够承受真实环境中的持续互动而不易损坏 [21] - 跨具身性研究:探索通用大脑控制不同硬件平台的可行性,英伟达GR00T项目致力于构建适配多型号机器人的统一模型 [22] - 数据策略创新:采用金字塔结构整合真实机器人数据、模拟数据和神经模拟数据,通过潜在动作提取算法提升训练效率 [22] 企业技术路径 - 英伟达GR00T项目采用端到端模型设计,追求"从光子到动作"的直接映射,模型参数仅20亿但性能出色 [21][22] - Skild AI专注于构建机器人通用大脑,主张通过单一共享模型解决数据稀缺问题 [8] - Agility Robotics强调真实场景部署,其Digit机器人已应用于制造业和物流领域 [10] - 波士顿动力保持技术延续性,在采用AI新技术同时保留传统控制理论工具 [18] - 1X Technologies探索远程操作界面抽象化,通过高级指令引导机器人自主完成精细操作 [27] 行业未来展望 - 硬件多样化趋势:当前人形机器人硬件同质化严重,未来将出现更多突破传统人体结构的设计创新 [30] - 专业型机器人先行:特定场景的"任务专家型"机器人将率先普及,解决劳动力短缺问题 [36] - 技术融合加速:机器人AI与数字AI界限逐渐模糊,真实世界互动数据将提升AI系统的验证能力 [33] - 社会接受度关键:机器人技术普及速度取决于社会接受程度和生产规模扩张能力 [36] - 长期颠覆性影响:十年内机器人技术可能像电力普及一样深刻改变社会生产和生活方式 [36]
黄仁勋年度演讲来了,Scaling Law失效只是假象,推理需求暴涨100倍,AI模型优化迎来新挑战|GTC 2025
AI科技大本营· 2025-03-19 09:49
演讲核心观点 - 英伟达推出下一代Blackwell Ultra芯片,提升AI训练和推理能力,并规划至2028年的芯片路线图[7][11][16] - 公司提出"AI工厂"概念,强调数据中心将从检索计算转向生成计算,预计到2028年数据中心资本支出超1万亿美元[43][69][71] - 发布个人AI超级计算机DGX Spark和DGX Station,面向模型微调与推理市场[19][21] - 布局量子计算领域,设立加速量子研究中心(NVAQC),推动量子计算与AI融合[23][25] - 推出人形机器人基础模型Isaac GR00T N1和开源物理引擎Newton,宣布"通用机器人时代已经到来"[31][33][165] 芯片与技术发布 - Blackwell Ultra芯片包含GB300 NVL72和HGX B300 NVL16两个版本,相比前代Hopper GPU,大语言模型推理速度提升11倍,算力增加7倍,内存容量扩大4倍[8] - 公布未来芯片路线图:2026年推出Rubin架构,2027年更新Rubin Ultra,2028年推出Feynman架构[11][14][16] - Rubin性能可达Hopper的900倍,Blackwell是Hopper的68倍[16] - 推出基于硅光子技术的Spectrum-X和Quantum-X交换机,能效提升3.5倍,信号稳定性提高63倍[28][30] AI与计算趋势 - 计算领域迎来拐点,AI增长加速,推理所需计算量比预期多100倍[43][63] - 从感知AI、生成式AI到自主式AI和物理AI的演进,每个阶段都带来新的市场机会[56] - 推出分布式推理服务库NVIDIA Dynamo,作为AI工厂的操作系统,并宣布开源[111][113] - 强调合成数据的重要性,需要生成万亿级token来训练AI模型[67] 行业应用与合作 - 与AWS、谷歌云、微软Azure等云服务商合作,将率先提供Blackwell Ultra实例[12] - 与戴尔、惠普、联想等服务器厂商合作,计划2025年底推出基于Blackwell Ultra的AI基础设施[12] - 与通用汽车(GM)合作构建未来自动驾驶车队,推出自动驾驶安全系统NVIDIA Halos[82][84] - 与思科、T-Mobile合作构建AI边缘计算无线网络堆栈[80] 机器人技术 - Isaac GR00T N1是全球首个开放且完全可定制的人形机器人基础模型,配套Isaac GR00T蓝图技术生成合成数据[31] - 开源物理引擎Newton由Google DeepMind和迪士尼共同开发,专为机器人设计[33] - 机器人Blue亮相,由Newton物理引擎驱动,展示具身智能技术进展[35][171] - 预测物理AI和机器人学将成为最大行业之一,机器人将作为数字工作者与人类并肩工作[148][165]
晚点对话梅卡曼德邵天兰:通用机器人的吹牛竞赛和现实路径丨具身智能对话#9
晚点LatePost· 2025-02-14 19:13
以下文章来源于晚点Auto ,作者晚点团队 晚点Auto . 从制造到创造,从不可能到可能。《晚点LatePost》旗下汽车品牌。 梅卡曼德机器人创始人 邵天兰 "太多人关注终局,更重要的是路径和速度。" 这是《晚点 LatePost》 「具身智能对话」系列的第 9 篇。该系列将持续访谈智能机器人和自动驾驶产业链头部公司。往期文章见文末合集#具身智能对话。 AlphaGo 用神之一手战胜李世石的 7 个月后,围棋爱好者邵天兰从德国归国创业,成立梅卡曼德(Mech-Mind)机器人。 换算到 2023 年的 AI 热潮里,这是一个典型的技术 "少年天才":清华本科毕业、德国慕尼黑工大机器人方向深造,在德国参与过机器人创业公司;回国创业 时不过 27 岁,相当于 2023 年的 "95 后"。 而经过 8 年真实场景的摔打,拿过红杉、IDG、美团、启明、英特尔等头部机构融资的邵天兰现在说,"自己是搬砖的人"。 梅卡曼德的 3D 高精度相机和与之配合的感知、规划算法已进入上千个场景:既在金库码钱,也在砖厂搬砖,能检测汽车电池,也给浴缸钻孔,码放 5800 元 一箱的五粮液。 他们的客户有上汽、蔚小理、丰田、宁德时代 ...