具身智能之心

搜索文档
具身智能之心sim2real交流群来啦!
具身智能之心· 2025-06-28 15:58
行业交流群 - 交流群专注于sim2real及sim2real2sim技术在机械臂、双臂、四足、人形等领域的应用讨论 [1] - 群内严格禁止广告宣传,违规者将被拉黑清除 [1] - 群满后可添加指定微信并备注"sim2real加群"以获取邀请 [1]
清华90后博士厨房机器人融资数千万,获北京首张具身智能餐饮许可证
具身智能之心· 2025-06-28 15:48
更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 作者丨 量子位 编辑丨 量子位 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 让机器人下厨房,获数千万元融资! 享刻智能正式官宣完成数千万元Pre-A轮系列融资,投资方阵容相当豪华:世纪长河科技集团、启迪之星联合领投,网龙天映创投、广华创投 等多家机构跟投。 创始人陈震为机器人圈的连续创业者, 拥有北航计算机学士、清华计算机硕士学位,目前还是清华大学未来实验室博士生。 2020年,他创办的视觉导航定位方案公司速感科技被九阳母公司JS环球生活全资收购,随后出任Shark Ninja机器人研发中心总经理。 时隔三年,这位连续创业老兵再次出发,瞄准厨房服务机器人。 就在去年9月,享刻智能的LAVA机器人拿下了北京市首张具身智能机器人食品经营许可证,成为全国第一个"持证上岗"的AI厨师。 千台订单在手,出海步伐加快 团队推出的LAVA机器人,能2分钟炸好一盘薯条、做汉堡,未来还要学会做冰淇淋和调饮品。 最厉害的是,它能通过视觉识别不同食材,自主判断烹饪时间, ...
数据、算法和本体,小白入门很难绕开任何一个部分......
具身智能之心· 2025-06-28 15:48
硬件部分:预算足的实验室有经费购买20-30w的本体,预算不足的同学依赖3D打印自己制作机械 臂或者采购性价比高的硬件平台,甚至在仿真里面做,研究比较受限。 我们的具身社区针对这三个大的模块做了比较充足的分享,包括数据采集方案、本体、仿真以及 算法部分,同时也给大家提供了几款高性价比的机械臂平台,助力研究。 社区目标是3年内打造一个万人聚集的地方,这里也非常欢迎优秀的同学加入我们(目前已经有很 多具身研究前沿的学者加入我们了)!我们和多家具身公司搭建了学术+产品+招聘完整的桥梁和 链路,同时内部在教研板块也基本形成了闭环(课程 + 硬件 + 问答)。社区里也能看到很多最新 的行业观点、技术输出。现在本体是怎么样的?有哪些不足?数据采集的成功率和有效率怎么提 升?sim2real怎么做的有效点?这些都是我们一直关注的。 入门具身离不开3个要素,数据+算法+本体,说实话很多同学只懂算法,甚至说懵懵懂!数据的采 集更是需要经验,遥操和retargeting方案,很多人采集不到真实有效的数据。本体更是许多同学触 不可及的东西,高性价比的平台和仿真是很多同学入门的第一步。 数据部分:遥操采集依赖本体,成本较高。但前处理 ...
北航×新国立×上交发布RoboCerebra:长时序机器人操作推理的全新评测基准
具身智能之心· 2025-06-28 15:48
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 SonghaoHan等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 Ideal Dynamic Memory Execution Memory Exploration Mix 1 问题背景与动机 近年来,视觉-语言模型(VLM)凭借对图像与文本的强大对齐能力,为机器人带来了"看图执行指令"的全 新范式。研究者只需给出一句自然语言命令,机械臂便能在仿真或真实桌面环境中完成抓取、移动、放置 等操作。这类系统通常以 VLA 等 "小脑" 模型的形式存在:直接把多模态观测映射到低层控制信号,强调 即时反应与传感-运动耦合。然而,随着任务场景从单步抓取扩展到家庭级复合操作,仅靠小脑反应已难以 胜任;机器人还需要 "大脑" VLM 进行长期规划、记忆管理与自我反思,并与小脑 Controller 高效协同。 现有公开基准的平均任务长度不足 500 步,也很少显式考察大小脑协作(Planner ...
具身的秋招马上要开始了,去哪里抱团呀?
具身智能之心· 2025-06-28 15:48
行业发展趋势 - 自动驾驶和具身智能成为AI技术发展的主线 支撑了近一半的技术路线和融资金额 [1] - L2~L4自动驾驶功能逐步实现量产 人形机器人和四足机械狗等具身智能产品完成复杂动作演示 [1] - 行业对技术和人才需求旺盛 尤其在自动驾驶、具身智能、3D视觉和机器人领域 [1] 求职社区概况 - AutoRobo知识星球专注于自动驾驶、具身智能和机器人方向的求职交流 成员近1000名 [2] - 成员包括地平线、理想汽车、华为、小米汽车等公司的社招人员以及2024-2025届秋招学生 [2] - 社区提供面试题目、面经、行业研报、谈薪技巧、内推资源和简历优化等服务 [2] 招聘信息 - 日常分享算法、开发、产品等岗位信息 涵盖校招、社招和实习机会 [3] - 寒武纪持续招聘2026届实习生 包括C++开发、PyTorch框架研发和软件测试开发等岗位 [4] 面试资源 - 汇总自动驾驶和具身智能方向的"一百问"系列 涵盖毫米波视觉融合、BEV感知、多传感器标定等核心技术 [6][7] - 具身智能领域包含Occupancy感知、相机标定、端到端自动驾驶等专项问题 [8][12] - 整理社招/校招全流程面经 包括代码题、项目细节和面试复盘 [15][19] 行业研究 - 提供领域研报帮助理解行业发展状态、前景和产业链 如世界机器人报告、中国具身智能创投报告等 [13][14] - 深度分析具身智能技术路线、市场机遇和人形机器人量产硬件等专题 [14] 职业发展支持 - 汇总机器人、自动驾驶和AI类专业书籍 构建知识体系 [18] - 分享谈薪技巧、HR面常见问题和岗位薪资谈判策略 [17][20] - 提供转行经验、面试官建议和岗位技能树等职业指导 [20]
第一篇具身领域论文应该怎么展开?
具身智能之心· 2025-06-27 17:41
EI/中文核心/毕业论文/申博等 点击下方 卡片 ,关注" 具身智能 之心 "公众号 还在为论文选题抓耳挠腮?被数据建模折磨到头秃?面对导师批注手足无措?别慌!具身智能之心,资深导师团 队在线 "救援",一站式解决你的论文烦恼! 【前沿论文辅导重磅上线!多模态大模型/VLA/3D感知/数据生成/视觉语言导航/机器人导航/具身智能等顶会 方向1V1定制化辅导】 CCF-A到CCF-C SCI一区到四区 你是否正在研究以下前沿领域却苦于突破瓶颈? 多模态大模型(视觉-语言预训练、跨模态推理) 视觉语言动作(VLA)(端到端、分层等) 视觉语言导航(VLN)(Embodied QA、指令跟随、场景理解) 机器人抓取与导航(Sim2Real、强化学习、3D场景建模) 具身智能体泛化(跨任务迁移、零样本适应、仿真环境构建) 3D高斯泼溅(3DGS)(实时渲染、动态场景建模、SLAM结合) 端到端具身智能体(决策闭环、多模态传感器融合) 具身合成数据生成(自动标注、域适应、数据增强) 为什么选择我们? ✅ 顶会/顶刊导师团队:来自CMU、Stanford、MIT等名校的PhD及大厂研究员,覆盖ICRA、NeurIPS、C ...
ICCV 2025不完全汇总(具身/自驾/3D视觉/LLM/CV等)
具身智能之心· 2025-06-27 17:41
具身智能相关 - GaussianProperty通过LMMs将物理属性整合到3D高斯模型中 [4] - Aether提出几何感知的统一世界建模方法 [4] - A0模型构建了分层架构实现通用机器人操作 [4] - PASG框架实现机器人操作中的几何基元自动提取与语义锚定 [4] - MoMa-Kitchen提供超过10万样本的移动操作导航基准数据集 [4] - OVA-Fields开发弱监督开放词汇affordance场用于机器人部件检测 [4] 自动驾驶相关 - ETA采用双模型架构提升自动驾驶系统效率 [4] - DriveArena构建可控生成式自动驾驶仿真平台 [4] - Epona开发自回归扩散世界模型用于自动驾驶 [4] - SynthDrive建立高保真传感器仿真与驾驶数据合成管线 [4] - StableDepth实现场景一致的单目深度估计 [4] - CoopTrack探索协同序列感知的端到端学习 [4] - U-ViLAR通过可微分关联实现不确定性感知的视觉定位 [4] 3D视觉与点云 - StruMamba3D探索结构Mamba模型用于点云自监督学习 [6] - DiST-4D开发解耦时空扩散模型用于4D驾驶场景生成 [6] - InvRGB+L实现复杂场景的统一颜色与LiDAR反射率建模 [6] - GS-Occ3D利用高斯泼溅扩展纯视觉占据重建规模 [6] - Detect Anything 3D实现野外环境3D物体检测 [6] - PanSt3R保证多视角全景分割一致性 [6] 大模型与生成技术 - 图知识检索与推理方法增强MLLMs处理未知领域能力 [8] - TaxaDiffusion开发渐进式训练扩散模型实现细粒度物种生成 [10] - G2D通过梯度引导蒸馏提升多模态学习效果 [13] - CL-Splats实现高斯泼溅的持续本地优化学习 [13]
机器人顶会RSS 2025奖项公布!
具身智能之心· 2025-06-27 16:36
作者丨 机器之心 编辑丨 机器之心 点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 恭喜获奖者。 RSS(Robotics: Science and Systems,机器人科学与系统会议)是机器人领域顶级学术会议,自 2005 年起每年举办一次,该会议旨在促进机器人领域的科学研究和 技术应用的发展。 今年大会已于 6 月 21 日至 25 日在美国洛杉矶举行。杰出 Demo 论文奖、杰出系统论文奖、杰出学生论文奖、杰出论文奖多个奖项已经公布。 地址:https://roboticsconference.org/program/awards/ 杰出 Demo 论文奖 论文标题:Demonstrating MuJoCo Playground 论文链接:https://www.roboticsproceedings.org/rss21/p020.pdf 论文主页:https://playground.mujoco.org/ 机构:UC 伯克利、Google ...
保姆级具身智能实战:从零基础到强化学习与Sim2Real
具身智能之心· 2025-06-27 16:36
当我们谈论机器⼈学习时,⼀个核⼼问题是:如何让机器⼈在不损坏昂贵硬件的情况下,快速掌握复杂的运动 技能?传统的⽅法是在真实机器⼈上进⾏⼤量试错,但这种⽅式不仅成本⾼昂,⽽且效率低下,甚⾄可能存在 安全⻛险。MuJoCo的出现彻底改变了这⼀现状。 在近20年AI发展的路线上,我们正站在⼀个前所未有的转折点。从早期的符号推理到深度学习的突破,再到 如今⼤语⾔模型的惊艳表现, AI 技术的每⼀次⻜跃都在重新定义着⼈类与机器的关系。⽽如今,具身智能正 在全面崛起。 想象⼀下这样的场景:⼀个机器⼈不仅能够理解你的语⾔指令,还能在复杂的现实环境中灵活移动,精确操作 各种物体,甚⾄在⾯对突发情况时做出智能决策。这不再是科幻电影中的幻想,⽽是正在快速成为现实的技术 ⾰命。从Tesla的Optimus⼈形机器⼈到Boston Dynamics的Atlas,从OpenAI的机械⼿到Google的RT-X项⽬,全 球顶尖的科技公司都在竞相布局这⼀颠覆性领域。具身智能的核⼼理念在于让AI系统不仅拥有"⼤脑",更要拥 有能够感知和改变物理世界的"身体"。这种AI不再局限于虚拟的数字空间,⽽是能够真正理解物理定律、掌握 运动技能、适应复 ...
清华大学最新综述!具身AI中多传感器融合感知:背景、方法、挑战
具身智能之心· 2025-06-27 16:36
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Shulan Ruan等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要 的。 出发点与动机 1)具身AI与多传感器融合感知的重要性 近年来,随着深度学习和大型语言模型(LLM)的快速发展,人工智能在各个领域取得了显著进展。具身 AI作为AI的重要方向,指的是以物理实体为载体,通过在动态环境中实时感知来实现自主决策和行动能力 的智能形式,在自动驾驶、机器人群体智能等领域有广泛应用场景,是突破AI发展瓶颈、实现通用人工智 能(AGI)的关键路径。 在具身AI系统构建中,传感器数据理解是连接物理世界与数字智能的核心环节。具身智能体需要融合视觉 相机、毫米波雷达、激光雷达(LiDAR)、红外相机和惯性测量单元(IMU)等多模态传感器数据,以实 现对环境的全景感知。多传感器融合感知(MSFP)对实现具身AI的稳健感知和准确决策能力至关重要,例 如视觉相机易受光照变化干扰,而激光雷达在雨雾天气性能会大 ...