Workflow
Embodied intelligence
icon
搜索文档
MuJoCo具身智能实战:从零基础到强化学习与Sim2Real
具身智能之心· 2025-07-07 17:20
在近20年AI发展的路线上,我们正站在⼀个前所未有的转折点。从早期的符号推理到深度学习的突破,再 到如今⼤语⾔模型的惊艳表现, AI 技术的每⼀次⻜跃都在重新定义着⼈类与机器的关系。⽽如今,具身智 能正在全面崛起。 MuJoCo ( Multi-Joint dynamics with Contact )不仅仅是⼀个物理仿真引擎,它更是连接虚拟世界与现实世 界的重要桥梁。在具身智能的技术⽣态中, MuJoCo 扮演着⾄关重要的⻆⾊,它为机器⼈学习提供了⼀个 ⾼保真、⾼效率的训练环境。 当我们谈论机器⼈学习时,⼀个核⼼问题是:如何让机器⼈在不损坏昂贵硬件的情况下,快速掌握复杂的 运动技能?传统的⽅法是在真实机器⼈上进⾏⼤量试错,但这种⽅式不仅成本⾼昂,⽽且效率低下,甚⾄ 可能存在安全⻛险。MuJoCo的出现彻底改变了这⼀现状。 通过 MuJoCo ,研究者可以构建⾼度逼真的虚拟机器⼈和环境,让 AI 系统在仿真中进⾏数百万次的试验 和学习。这种⽅法的优势是显⽽易⻅的:⾸先,仿真速度可以⽐现实时间快数百倍,⼤⼤加速了学习 过 程;其次,在虚拟环境中,机器⼈可以尝试各种极端情况⽽不⽤担⼼硬件损坏;最重要的是,通过精⼼ ...
研选 | 光大研究每周重点报告20250628-20250704
光大证券研究· 2025-07-04 22:17
越疆投资价值分析 - 全球协作机器人龙头地位,商业化能力有望持续验证 [3] - 技术壁垒全球领先,全栈自研构筑护城河,为后续发展及降本奠定基础 [3] - 全球化布局成效显著,受益制造业转移红利 [3] - 积极切入具身智能及人形机器人行业,打开长期成长空间 [3] 行业与公司研究 - 市场观点纷繁芜杂,研究聚焦总量、行业及公司领域,筛选有价值信息 [2] - 越疆(2432 HK)作为全球协作机器人龙头厂商,加速实现具身智能商业化 [3]
李飞飞最新对话
投资界· 2025-07-04 20:05
AGI最新判断。 作者 | 闻乐 不圆 来源 | 量子位 (ID:QbitAI) 在我看来,没有空间智能,通用人工智能就不完整。 这是"AI教母"李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。 不过她有自己的表述,从进入人工智能领域开始,她就确定了她终身奋斗的梦想: 让智能体能够讲述世界的故事 。 而这,离不开 空间智能 。 正如她本人所说: 我整个职业生涯都在追逐那些极其困难、近乎疯狂的问题。 李飞飞如今聚焦于空间智能领域——这个人工智能最艰难的领域之一。 她认为 3D世界建模 对于实现AGI至关重要,并表示: 理解三维世界、生成三维世界、推理三维世界、在三维世界中做事,是人工智能的基本问题。 她的目标是创建一个超越平面像素、跨越语言障碍、能够真正捕捉三维世界结构和空间智能的 世界模型 。 在这次对话中,她从ImageNet的起源和影响说起,讲述了AI范式转变与关键突破,并提到了3D建模面临的挑战以及空间智能的数据 缺失问题。 量子位翻译并总结了全文,让我们一起来学习李飞飞的最新认知和分享。 ImageNet为现代计算机视觉搭建数据骨架 Q:你最早创建的项目之一是2009年的Image ...
自动驾驶论文速递 | 世界模型、VLA综述、端到端等
自动驾驶之心· 2025-07-02 15:34
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 世界模型Epona 地平线、清华、北大等团队ICCV'25中稿的自回归扩散世界模型工作,同时可以不依赖视频预测独立输出轨 迹规划。 主要贡献: 论文标题:Epona: Autoregressive Diffusion World Model for Autonomous Driving 论文链接:https://arxiv.org/abs/2506.24113 项目主页:https://kevin-thu.github.io/Epona/ 长时序生成。Epona可以实现长达2分钟的长时间生成,显著优于现有的世界模型; 实时轨迹规划。独立的多模态生成架构能够在视频预测不可用的情况下独立输出轨迹规划,从而显著降 低了推理FLOPS。这实现了高质量甚至实时的轨迹规划,高达20Hz的帧率; 视觉细节的保存。Epona的自回归公式采用连续视觉标记器而不是离散标记器,从而保留了丰富的场景 细节; 可视化: 算法框架: 实验结果: | Metric | | | | DriveGAN [30] DriveDreamer [5 ...
同样的idea别人中了CVPR,你的却被秒拒?
自动驾驶之心· 2025-07-02 10:05
与其讨论同样的idea别人为什么能中顶会,不如讨论在同样的idea下顶会的论文究竟强在哪里? 1. 是否为一个point solution? 同样的idea ,如果单纯把某些指标刷的很高那多半中不了顶会。那就是point solution,本身而言不具备太大的影响力。 顶会的成果,绝大部分不单纯只 能用在某个特定的地方,这至少一个系列的方法。 那么对于想要快速有科研成果的小伙伴来说, 最重要的问题莫过于如何能高效、精准、短平快地中稿,特别是中稿顶会。 在前沿且复杂的自动驾驶、具 身智能、机器人领域,没有专业的领路人发顶会真的很难! 为此,我们为有需要的小伙伴推出了深度辅导,面向计算机全领域及AI4s领域,提升论文中稿率,直至拿下顶会! 能中的文章才是好文章, 咨询更多扫码添加: 适用人群 我们能提供什么? 2. 文章的方法实现起来是否困难? 同样的idea,但是别人的论文实现无难度,效果还杠杠的;或者实现起来虽然很复杂,但是使用起来很容易,这样的论文不中什么样的论文中? 从idea、实验设计、数据集选择、跑通baseline最后到初稿的写作, 任何一个环节的细微差别都会导致最后投稿区位的巨大不同。 清晰的科研 ...
上岸小厂,心满意足了。。。
自动驾驶之心· 2025-07-01 12:04
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 这几年以自动驾驶和具身智能为主线的AI技术不断突破,撑起了近一半的技术路线和融资金额。但是自 动驾驶行业趋于饱和,有不少同学去年校招的时候几近崩溃,十月份了还没有offer。 好在最后 还是坚持 下来了,虽然拿到小厂offer,结果还是满意的。 从L2~L4自动驾驶功能的不断量产到人形机器人完成跳舞、四足机械狗在沙漠与丛林跳跃。很幸运能够 完整的经历这一发展周期,我们非常清晰行业对技术和人才的需求。 做了3年多的技术自媒体,在自驾、具身智能、3D视觉、机器人领域,我们沉淀了大量的内容。但后期陆 续收到了许多同学关于就业的求助,谈薪、避坑、职位选择、跨行等都是大家很关注的问题。我们一直 想给大家这样一个平台,让需要就业的同学能够快速匹配到自己的岗位,事半功倍!近半年的筹划,我 们推出了AutoRobo知识星球,一个覆盖机器人、自动驾驶、具身智能方向的求职社区! AutoRobo知识星球 这是一个给自动驾驶、具身智能、机器人方向同学求职交流的地方,目前近1000名成员了,成员范围包 含已经工作的社招同学,如地平线 ...
1.5m/s极速+50kg负载!大象机器人新底盘卷翻机器人开发圈
机器人大讲堂· 2025-07-01 10:39
在人工智能与机器人技术加速迭代的当下,自动驾驶算法正从虚拟测试走向真实道路与物流运输场景落地,专 业级机械臂也逐渐成为课堂示教编程的得力助手。随着行业发展,传统基础编程实践已难以满足需求,科研人 员与开发者更热衷于在仿真环境中钻研多机协同算法等前沿课题;与此同时,实验室对机器人在模拟场景下, 实现测试识别、精准抓取、智能避障、高效搬运全链路流程的要求也水涨船高。 在一背景下, 大象机器人于近日推出移动复合机器人 myAGV Pro, 为智能机器人领域的探索与实践带来新 的解决方案。 据机器人大讲堂了解,myAGV Pro是 大象机器人 旗下的 全向转向系统小车 ,适配大象机器人旗下轻量化 协作机械臂生态和市面上大部分通用协作机器人,能够完成 多目标环境检测、语音语义识别 等人工智能的相 关应用。大象机器人推出该产品主要旨在为研究人员与开发者在智能机器人领域进行 仓储搬运、教学学习、 创新应用、科研研究和竞技比赛 等场景提供理想平台。 myAGV Pro 中文宣传片 3 丰富生态,支持二次开发 原 生 搭 载 Ubuntu 22.04 , 提 供 RVIZ 、 Gazebo 仿 真 环 境 支 持 。 同 时 ...
中国民营经济组织达1.85亿户 市场主体活力持续增强
长江商报· 2025-06-30 16:29
民营经济总体发展 - 截至2025年5月底全国实有民营经济组织1.85亿户占经营主体总量的96.76%同比增长2.3% [2] - 私营企业与个体工商户构成民营经济"双引擎"私营企业数量超5800万户同比增长5.2%个体工商户达1.27亿户同比增长1.0% [2][3] 私营企业发展动态 - 私营企业在新能源高端装备制造等战略性新兴产业持续发力光伏产业中民营企业占全球组件供应量80%以上新能源汽车领域民营车企销量占比超70% [3] - 华为2024年研发费用支出1797亿元占收入20.8%近十年累计研发投入超12490亿元全球有效授权专利超15万件 [3][4] - 比亚迪2024年新能源汽车销量超425万辆同比增41.1%其中纯电车型占比41.5%插混车型占比58.5%同时斩获中国车企销量冠军及全球新能源车销量冠军 [4] - 私营企业贡献全国70%以上技术创新成果80%以上专精特新"小巨人"企业来自民营经济 [4] 个体工商户发展特征 - 个体工商户广泛活跃于社区零售餐饮服务家政维修等领域通过数字化工具实现线上线下融合经营 [5] - 每户个体工商户平均带动就业超2人全国个体工商户合计提供超2.5亿个就业岗位 [6] - 政策层面通过税费减免金融支持等措施助力个体工商户发展并推动其参与街区改造特色街区打造等区域经济活化项目 [6] 细分领域创新案例 - 黑芝麻智能在2025上海车展发布华山A2000系列芯片Pro版单颗算力超越4颗行业旗舰芯片 [4] - 家政维修行业个体从业者通过技能培训与服务标准化提升借助平台认证提升市场信任度 [6]
双非研究生,今年找工作有些迷茫。。。
自动驾驶之心· 2025-06-30 13:51
自动驾驶与具身智能行业趋势 - 自动驾驶和具身智能公司对人才要求较高,倾向于招聘实力强、背景好的同学[2] - 行业技术方向正从传统方法向端到端、大模型、VLA、强化学习、3DGS等前沿领域转型[3] - 机器人初创公司融资活跃,未来几年发展前景可观[3] 职业发展建议 - 双非背景同学可考虑SLAM和ROS方向,从事机器人/具身智能相关的优化、集成类工作[3] - 建议关注机器人公司,虽然工作较苦但能学习到实打实的技术栈[4] - 具身智能是最前沿方向,但传统机器人仍是产品主线[4] 技术社区资源 - 知识星球提供自动驾驶视频课程、硬件及代码学习资料,以及全栈学习路线图和招聘信息[5] - 社区已形成学术+产品+招聘的完整链路,包含课程、硬件和问答闭环[5] - 社区关注行业技术动态、技术分享、讨论和求职信息,聚焦具身智能与自动驾驶结合等前沿话题[5] 前沿技术方向 - 四大前沿技术方向包括视觉大语言模型、世界模型、扩散模型和端到端自动驾驶[7] - 视觉大语言模型领域有多篇CVPR 2024论文,涉及预训练、迁移学习等方向[11][12] - 扩散模型在自动驾驶中的应用包括场景生成、数据增强等方向[38][39] 数据集资源 - VLM预训练数据集规模从百万级到百亿级不等,最大达12B样本[15] - 自动驾驶数据集涵盖2D/3D目标检测、语义分割、目标跟踪等任务,时间跨度从2009到2024年[21] - 语言增强的自动驾驶数据集支持文本解释、视觉问答等任务[22] 应用领域进展 - 智能交通领域主要研究语言引导的车辆检索和视觉问答技术[23] - 自动驾驶感知方向聚焦行人检测、目标指代等任务[24] - 定位规划领域探索语言引导导航和运动规划技术[25] - 决策控制方向研究大语言模型在自动驾驶决策中的应用[26] 端到端自动驾驶 - 端到端方法整合感知、预测和规划模块,实现自动驾驶全流程[27] - 相关研究关注模型可解释性、行为规划和场景生成等方向[45] - 世界模型在端到端驾驶中发挥重要作用,支持场景理解和生成[30][50]
公布最新研究!这次1XWorldModel如何颠覆人形机器人领域?
机器人大讲堂· 2025-06-29 11:53
2024年9月,1X Technologies (以下简称 "1X")发布全球首个人形机器人世界模型 1X World Model首证 Scaling Law(人形机器人数据显著增强扩展定律) 。 前不久, 1X对外公布了其世界模型在技术迭代和应 用场景上取得的多项突破,再度成为行业焦点。 据具身智能大讲堂了解, 1X World Model 是一种可以模拟现实世界在智能体作用下如何演变的生成式视频 模型, 其基于视频生成技术( Sora)和自动驾驶世界模型(端到端自动驾驶,E2EAD)构建形成,能够 通 过输入图像状态与动作指令 模拟出机器人在不同动作下的未来场景,预测机器人和操作对象之间的交互效 果,帮助人形机器人完成精准交互,解决具身机器人评估难题。 本次 1X World Model 最新突破集中在 三个方面: ▍ 动作可控性:从基础动作响应到复杂物理场景精准模拟 首次公开的 1X World Model具备根据不同动作命令生成不同结果的能力 , 通过展示以四种不同轨迹为条件 对世界模型进行的不同生成过程,且每条轨迹都从相同初始帧起始,清晰地呈现了其多样化生成特性。 在模拟物体间交互这一核心价值体现上 ...