Workflow
Isaac Lab
icon
搜索文档
在具身智能的岔路口,这场论坛把数据、模型、Infra聊透了
机器之心· 2025-09-29 10:52
行业核心观点 - 具身智能行业正处于技术路线分歧与探索阶段,面临数据稀缺、技术架构选择等关键议题 [1] - 行业已初步观察到具身智能的Scaling Law,预示扩大模型和数据规模可能有效 [24] - 阿里云作为云计算巨头,提前布局行业未来3到5年的基础设施需求,旨在为行业爆发做准备 [3] 数据路线之争:真机派 vs. 合成派 - 真机派主张通过遥操或互联网获取真实数据,基于VLA做模仿学习,认为真实数据是训练世界领先模型的根本 [5][14] - 合成派认为实现通用泛化能力需上万亿条数据,真机采集不可持续,主张通过仿真合成数据进行预训练,再用少量真实数据后训练 [5][8][9] - 真机派挑战“真机数据昂贵”共识,指出在国内供应链支持下,单个机器人成本可降至10万以下,规模化部署机器人采集数据成本可控 [12] - 合成派面临挑战:某些仿真数据获取依赖专业人力(如图形学博士),成本可能更高;仿真数据效率可能比真实数据差5-6个数量级 [11] 技术架构与模型形态 - 具身智能大模型被视为独立于语言模型的基础模型,因其需处理物理动作和接触的复杂性 [18] - 技术架构存在端到端与分层路线之争:分层架构考虑现实部署约束,符合生物进化规律;端到端架构旨在避免分层错误放大和层间理解鸿沟 [19] - 视觉语言动作模型(VLA)被视为当下更有潜力的路线,仅需100条数据即可见效,而世界模型需万级至亿级数据量,是更终局的路线 [21] - 世界模型被赋予重要作用,如辅助VLA进行自主学习探索、生成动作序列补充数据,与VLA是互补而非冲突关系 [20] 行业发展趋势与阿里云的角色 - 行业落地速度加快,多家公司分享了在工业制造、康复陪伴、教育竞赛等场景的实践 [24] - 阿里云基于智能驾驶行业经验,提前为具身智能行业的数据指数级增长和算力需求布局,提供全链路基础设施支持 [3][31][32] - 阿里云具备模型原厂优势,其开源模型Qwen-VL被大量具身智能公司用于后训练,最新Qwen3-VL模型针对具身智能需求优化 [37][38] - 阿里云将智能驾驶领域的工程经验复用至具身智能,提供从数据处理、模型服务到工具链集成的全套云上能力 [35][41][42] - 公司建议具身智能企业从第一天起规划云架构和AI基础设施,以应对量产阶段的数据激增和工程化挑战 [29][42]
英伟达、宇树、银河通用问答:未来10年机器人如何改变世界
21世纪经济报道· 2025-08-12 06:20
行业趋势与市场潜力 - 计算机和IT产业过去三四十年主要影响"信息空间",规模约5万亿美元,而全球产业总量超过100万亿美元,更大的价值在于触达物理世界的"原子"领域(如交通、制造、物流、医疗)[1] - 人工智能的出现使机器具备"物理智能"能力,计算机力量将进入100万亿美元的物理世界市场,机器人是实现这一跃迁的桥梁[1] - 中国在人工智能领域具备独特优势,全球近一半人工智能研究人员和开发者在中国,拥有无可匹敌的电子制造能力和大规模制造业基础[2] - 人形机器人市场潜力巨大,预计未来每三年产值乘10,头部企业从1000台增长到10万台,单价几十万元可达1000亿元产值,超过工业机械臂总产值[4] - 未来10年机器人市场可能超越当前所有工业机器人量,再往后10年可能超越汽车手机市场的万亿规模[4] 技术发展与创新 - 推动机器人发展和物理AI落地需要构建三类计算机:嵌入机器人本体的计算机(如Jetson Thor)、AI工厂计算机(如DGX、HGX系统)、仿真计算机[2] - 合成数据是推动具身智能快速落地的关键,真实世界数据仅占训练数据的1%,其余99%为合成数据[3] - 人形机器人设计本质由若干关节电机串联而成,未来通用AI成熟后硬件要求会越来越低,制造人形机器人可能像组装电脑一样简单[3] - 仿真平台(如Isaac Sim)可优化机器人运动与操控能力,Isaac Lab系统实现快速策略迭代[2] - 灵巧手研发是重点,已开发约20自由度的灵巧手,目标让机器人执行日常任务而非展示性动作,未来1-2年实现自然交互[3] 企业合作与产品进展 - 宇树科技和银河通用与英伟达合作,银河通用G1 Premium人形机器人首批搭载NVIDIA Jetson Thor,在工业码垛、拆垛等场景表现优异[2] - 宇树科技新型人形机器人R1部署英伟达全栈机器人技术,通过仿真平台优化能力[2] - 宇树科技去年推出9.9万元人形机器人,今年新版本售价约3.9万元,支持外观定制,预计年底前完成量产[3] - 宇树科技发布A2机器狗,自重37千克,持续负载30千克,空载续航20公里[3] - 银河通用与英伟达合作下一代人形机器人项目,从轮式形态转向纯双足设计,基于OpenWBT_Isaac平台进行数据采集与遥控控制[3] 商业化路径与展望 - 机器人规模化部署需要顶层算力与仿真能力构建技术底座、成本可控且可量产的硬件工程、合成数据驱动的大规模训练体系[4] - AI与机器人技术将像电力与蒸汽机的发明一样,推动人类文明迈向新高度[4] - 通用机器人将成为下一个价值数万亿美元、数万亿元人民币市场的革命性产品,核心要素包括机器人本体和具身智能模型[3]
民生证券:NVIDIA提出三大计算平台协同解决方案 具身智能浪潮已至
智通财经网· 2025-05-31 16:46
核心观点 - NVIDIA提出机器人三大计算平台协同解决方案,形成从训练到优化再到执行的完整体系,已与众多解决方案与服务提供商、机器人操作系统企业、机器人传感器制造商、机器人本体制造企业等达成合作,共建机器人生态系统,有望加速全行业进化历程 [1] NVIDIA的机器人战略布局 - 公司2014年起布局智能机器人领域,主要围绕通用算力、开发平台、大模型三大核心领域展开,主攻机器人"大脑" [2] - 向机器人公司提供主控芯片(Jetson Thor)、仿真训练平台(Isaac Lab)和工具(GR00T模型),帮助开发人员构建、部署和管理机器人,打造机器人底层开发生态 [2] 三大计算平台解决方案 - 每家机器人公司都必须构建三台计算机协同的解决方案:DGX(集NVIDIA软件&硬件专长)、AGX(机器人和嵌入式边缘AI应用平台)、Omniverse with Cosmos(基于AI驱动的系统) [3] - 人形机器人通用模型GR00T主要依托计算平台Jetson Thor提供算力、并基于Omniverse的Isaac Lab仿真训练平台进行训练,最终实现人形机器人仅通过自然语言指令即可完成与真实世界的交互 [3] Isaac Lab平台 - 由NVIDIA CUDA加速库(Isaac ROS)、应用框架(Isaac Lab 2.0)和AI模型(Isaac Manipulator及Isaac Perceptor)组成 [4] - 可将数百次或数千次人类演示转化为数百万次合成动作,为人形机器人提供四项关键技术支持:机器人基础模型、数据管道、仿真框架、Thor机器人计算平台 [4] - 可应用于工业机械臂、自主移动机器人、AI机器人领域,具备真实模拟、多应用模块化体系结构、无缝连接和互操作性等优势 [4] GR00T模型 - 2025年3月推出通用人形机器人基础模型GR00T N1,为开源模型,具备双系统架构,能够做到快速与缓慢思考 [5] - 基于Omniverse的Isaac Lab仿真训练平台、基于Thor芯片的人形机器人计算平台Jetson Thor,实现"AI+仿真+硬件"三位一体的创新 [5] - 可整合语言、视觉和运动控制模型,实现端到端任务执行 [5] 生态系统建设 - 2025年CES大会上14款搭载GR00T模型的机器人亮相,涉及中国企业6家、美国企业4家,其他国家企业4家 [6] - 与人行机器人厂商、机床厂商、核心零部件企业持续接触,逐渐构建人行机器人供应链体系 [6] - 构建基于NVIDIA解决方案、开发平台、大模型、Jeston Thor芯片的强大生态圈 [6] 行业影响 - 汽车零部件公司具有强客户卡位优势、强批量化生产能力,且主业产品与机器人具有高度相通性 [6] - 汽车主机厂纷纷入局人形机器人赛道,机器人供应链与车端将有较高重合度 [6]