具身智能之心
搜索文档
最近在具身领域做的一些事情,社区、硬件和求职......
具身智能之心· 2025-09-25 08:04
社区运营与近期动态 - 社区运营方近期主要推进硬件方案优化、社区体系完善和商务合作[3] - 针对用户反馈的硬件价格高、体验不佳问题,正在测试和开发具身产品平台,未来将在知识星球优先公开[3] - 计划在节后优化社区内容结构,解决体系零散问题,减少用户信息盲区[3] - 社区持续整合高校具身方向的招生需求(如RA、博士、博士后),为2026年升学求职提供提前准备渠道[3] - 社区提供简历内推服务,覆盖秋招和社招人群,直接对接企业需求[3] - 知识星球定位为全栈式具身智能社区,覆盖学术交流、求职内推、升学指导等闭环服务[3][6] - 社区团队开放招募,鼓励用户共同推动领域发展,并推出节日优惠券吸引加入[4] 社区内容体系与技术资源 - 社区已梳理超30种技术路线,涵盖benchmark、综述、入门指南等,缩短用户检索时间[6] - 邀请数十位一线产业界和学术界嘉宾入驻,提供答疑和深度交流机会[6] - 定期举办圆桌论坛与直播,主题覆盖机器人本体、数据、算法等前沿问题[6] - 社区内容按模块分类,包括数据采集、灵巧手、VLA模型、多传感器融合等13个技术板块[7] - 汇总近40个开源项目、超60个具身数据集及主流仿真平台,提供多类学习路线(如感知、交互、强化学习等)[14][15] - 针对小白和进阶用户分别提供技术栈入门路线和产业级项目方案[8][10] - 社区成员来自全球顶尖高校(如斯坦福、清华、ETH)和头部公司(如智元机器人、优必选等)[14] 社区专属福利与资源库 - 提供国内外具身智能高校实验室汇总,助力申研读博参考[18][19] - 整合国内外机器人公司信息,覆盖教育、医疗、工业等多元场景[22] - 汇总行业研报,跟踪大模型、人形机器人等领域动态[24] - 收录机器人导航、动力学、路径规划等基础理论书籍PDF[27] - 梳理机器人零部件品牌(芯片、激光雷达等)及3D相机厂商资源[29][33] - 开放数据采集方案(遥操作、动作捕捉)和开源数据集,覆盖感知、导航、大模型等方向[34][35][37] - 强化学习与VLA+RL等前沿方向工作汇总,提供应用训练参考[41][43][61] - 社区成员可自由提问,获得工作或研究方向的选择建议[75] - 目前社区已聚集近2000名用户和200家企业机构,促进产业与学术联动[78]
具身智能之心国庆&中秋福利来了!课程/社区/硬件/论文辅导等
具身智能之心· 2025-09-24 14:32
促销活动概览 - 公司于9月24日至10月12日期间推出国庆和中秋优惠活动 [1] - 活动涵盖知识星球、具身课程、硬件、论文辅导及超级折扣卡等多个产品线 [1] 知识星球优惠 - 新用户加入知识星球享受7折优惠 [1] - 老学员续费知识星球享受5折优惠 [1] 具身课程折扣 - 多门具身课程包括VLA、VLN、Diffusion Policy、强化学习、仿真等课程提供8折优惠 [2] - 购买超级折扣卡后,1年内所有课程享受7折优惠 [4] 论文辅导服务 - 1对1论文辅导提供1000元最多可抵扣5000元的优惠 [4] - 1对6的VLA论文辅导立减1000元 [4] 硬件产品促销 - 公司提供强化学习平台、具身机械臂(舵机版)、具身机械臂(电机版)等科研硬件 [4] - 具体硬件产品包括全栈教研平台黑武士001、足式/强化学习科研平台TRON1、桌面级机械臂科研平台 [7] 其他福利专区 - 大模型星球售价99元一年,涵盖技术、行业及求职内容 [6] - 超级折扣卡售价299元,提供自驾课程7折优惠,有效期一年 [7] - 知识星球会员可获赠7门精品课程 [6] 联系方式与后续行动 - 用户可添加小助理微信AIDriver005或扫描海报二维码咨询详情及领取优惠券 [5] - 部分课程节后将再次涨价 [6]
准备搞一个具身的吃瓜群!
具身智能之心· 2025-09-24 14:32
文章核心观点 - 公众号“具身智能之心”的运营者“峰哥”为满足社区粉丝需求,创建了一个非正式的、专注于行业交流的社群 [1][2] - 该社群旨在提供一个轻松的环境,供成员讨论行业动态、产品、学术、工作、求职及创业等话题,而非转发公众号的正式内容 [2] - 社群规模限定为500人,满员后将关闭加入通道,目标用户为具身智能工业界从业者或相关科研人员 [2][3] 社群创建背景与目的 - 创建动因源于粉丝反馈,希望有一个不那么学术化、可以日常交流行业八卦、求职等话题的社群 [1] - 运营者认识到现有社群过于学术化,与教育科技IP属性有关,因此决定创建一个更有趣的交流群 [2] - 新社群明确不会转发公众号文章和直播内容,专注于行业交流、产品讨论、学术讨论及工作生活话题 [2] 社群运营规则与加入方式 - 社群规模严格限制在500人以内,满员后即停止接纳新成员 [2] - 目标成员需为正在具身智能工业界任职或从事相关科研活动的人员 [2] - 加入方式为添加指定微信,并备注“昵称+机构/公司+入群”以完成验证 [3]
今日Talk来啦!具身智能新基建:从大模型到真实世界
具身智能之心· 2025-09-24 10:30
活动概览 - 北京智源人工智能研究院将于2025年9月24日周三14:00-17:30举办一场关于具身智能新基建的行业分享活动 [1][2] - 活动地点位于北京市海淀区智源大厦一层报告厅 [2] - 活动由北京智源人工智能研究院主办,并由百度飞桨、具身智能之心、机器人大讲堂、始智AI Wisemodel、中国互联网协会人工智能工委会等多家行业机构协办 [2] 活动日程与核心议题 - 活动开场将由北京智源人工智能研究院副院长兼总工程师致辞 [3] - 议题一:介绍“具身智能的创新基座 - 智源具身一站式平台”,由该院具身数据负责人姚国才主讲 [3] - 议题二:介绍“智源DataCube(数据魔方)智能视频半台”,由该院算法研究专家主讲 [3] - 议题三:探讨“具身大小脑操作框架与具身大小脑模型构建”,由该院具身大小脑大模型负责人陈贤生主讲 [5] - 议题四:进行“智源评测全面升级:从大模型到真实世界”的发布,包括“模型评测分析及智源评测2025秋季榜单发布”,由该院智能评测负责人及高级研究员主讲 [5] - 议题五:分享“FlagScale在具身智能场景下的技术实践与价值验证”,由该院AI框架研发组具身智能方向负责人何宸锐主讲 [5] - 活动日程中包含一段休息时间 [4] 活动参与方式 - 活动提供线上转播,由“具身智能之心”全程转播 [1] - 参与者可通过扫码报名参加线下活动 [6] - 参与者可通过扫码加入“智源具身微信交流群”进行行业交流 [6]
【CEAIS 2025】全日程公布,参会早鸟报名火热进行中!
具身智能之心· 2025-09-24 08:04
会议概况 - 第二届中国具身智能与系统大会(CEAIS 2025)将于2025年11月1日在陕西西安建国饭店举办 [4] - 大会预计将吸引超过1000名与会者 [4] - 会议日程包括2025年10月31日的报到、晚餐及专委会增选会议,以及11月1日的开幕式、4场主旨报告和15场技术分论坛 [7][8] 主办方背景 - 西安交通大学于1986年成立了国内最早的人工智能专职研究机构“人工智能与机器人研究所”(人机所),并于2018年12月在此基础上成立“人工智能学院” [2] 会议核心议题与专家阵容 - 大会特邀十余位院士及近百位资深专家,深入探讨具身智能基础模型、世界模型与具身学习、网联具身智能、计算架构与芯片、智能驾驶、人形与仿生机器人等热点议题 [4] - 技术分论坛涵盖具身智能基础模型、计算架构与芯片、网联具身智能、具身智能驾驶、自动化实验室、机器人传感器、教育实践、世界模型与具身学习、人形与仿生机器人、标准化、情感具身智能、照护机器人等方向 [8][9][10][11][12] 会议注册与合作信息 - 会议注册费分为非会员、会员和学生三类,早鸟注册费(2025年9月30日及以前)分别为1800元、1200元和800元,普通注册费(2025年10月1日-10月31日)分别为2000元、1400元和1000元 [41] - 大会招募钻石合作单位(20万元)、金牌合作单位(10万元)、银牌合作单位(5万元)和展位合作(2万元),并提供相应的宣传权益和参会名额 [45][46]
跨越仿真与真实数据鸿沟:Real2Sim2Real重要工作一览!
具身智能之心· 2025-09-24 08:04
行业研究趋势 - 具身智能领域的研究重点正从高成本的真实数据采集转向利用仿真技术进行数据生成和策略迁移,即Real2Sim2Real技术路线 [1] - 该技术路线旨在通过仿真与真实数据之间的迁移学习,在少量或零真机数据下实现良好的机器人操作效果 [1] - 近三年该领域的研究成果集中发表在ICRA、CoRL、IROS、CVPR等顶级机器人及人工智能会议上 [1] 关键技术进展 - 3D高斯溅射(3D Gaussian Splatting)技术被广泛应用于提升仿真环境的真实感和物理一致性,例如RL-GSBridge和RoboGSim等项目 [3][18] - 针对复杂操作任务,如双手机器人灵巧操作(DexMimicGen)和可变形线性物体操作,开发了专用的数据生成和策略适应方法 [5][9] - 大规模生成模型和基础模型被集成到仿真流程中,用于示范生成(如Real2Gen、CyberDemo)和奖励设计(如R*项目利用大语言模型) [13][16] 学术机构与产业参与 - 全球顶尖学术机构是该领域研究的主力,包括加州大学伯克利分校、斯坦福大学、麻省理工学院、卡内基梅隆大学、清华大学、上海交通大学等 [4][5][9][13][15] - 领先的科技公司如英伟达、Google DeepMind、地平线机器人已深度参与相关技术研发 [5][6][9] - 研究社区规模显著,例如具身智能之心知识星球已聚集近2000名成员进行交流 [1][19] 应用场景拓展 - 技术应用覆盖广泛的机器人操作场景,包括蘑菇采摘、食品制备、水下软鳍运动、机器人辅助喂养等特定领域 [4][11][13][18] - 在机器人导航、运动规划以及群体机器人行为涌现等宏观系统层面也有深入研究 [6][9][15] - 部分研究开始探索跨具身(Cross-Embodiment)学习,旨在实现不同形态机器人之间的知识迁移 [10]
每当有人咨询具身入门的路线时,我一定会推荐这套完整的教程
具身智能之心· 2025-09-24 08:04
文章核心观点 - 具身智能技术架构围绕“大脑”(感知与规划)和“小脑”(运动执行)两大模块构建,技术演进经历了从低层感知到高层任务理解与泛化的多个阶段,目前正进入多技术融合创新期 [3] - 技术发展推动产品在人形机器人、机械臂、四足机器人等形态上落地,应用于工业、家居、餐饮、医疗康复等领域,行业呈现融资和岗位爆发式增长 [12] - 为应对行业对体系化知识的迫切需求,推出了覆盖具身智能全栈技术的课程,旨在帮助从业者和学习者系统掌握从基础任务到前沿模型应用的完整知识体系 [12][14] 技术架构与细分领域 - 具身智能领域主要划分为负责思考感知和任务规划的“大脑”,以及负责高精度运动执行的“小脑” [3] - 细分技术模块包括仿真、VLA(视觉-语言-行动)、Diffusion Policy、VLN(视觉语言导航)、世界模型、强化学习等 [5] - VLA和世界模型是当前在自动驾驶和具身领域同时发力的两大技术路线 [5] 关键技术方案 - VLA模型主要研究热点为基于大模型的端到端方案和基于Diffusion技术的分层方案,VLA与强化学习结合方案正成为新探索方向 [5] - Diffusion Policy作为行动模块,负责学习具体动作执行,主要研究方向包括状态扩散、动作空间扩散、三维空间扩散等 [6] - 仿真技术当前重点在于Sim2Real和Real2Sim2Real方案,以解决真机泛化差的问题,该方案已获多家具身公司认可 [6] - VLN当前更关注于目标导航,与移动操作相关联,Map-free方案有利于任务泛化 [6] 技术演进阶段 - 第一阶段技术研究聚焦于抓取位姿检测,通过点云或图像预测末端执行器姿态,实现静态物体抓取,但缺乏对任务上下文和动作序列的建模 [7] - 第二阶段进入行为克隆阶段,机器人借助专家演示数据学习从感知到控制的端到端映射,具备模仿人类完成复杂任务的能力,但存在泛化能力弱、误差累积等问题 [7] - 第三阶段(2023年起)兴起Diffusion Policy方法,通过扩散模型生成整个动作轨迹,提升策略稳定性与泛化能力;2024年进入VLA模型阶段,实现多模态协同与任务泛化能力提升 [8] - 第四阶段(2025年以来)探索VLA模型与强化学习、世界模型、触觉感知等模块融合,以弥补VLA模型在反馈、未来预测、多模态感知方面的局限 [10] 行业应用与影响 - 技术发展推动人形机器人、机械臂、四足机器人等产品落地,服务于工业、家居、餐饮、医疗康复等多个领域 [12] - 行业融资和岗位呈现爆发式增长,吸引大量人员转入具身智能领域进行研究 [12] - 产业界重视推动具身智能从“论文”走向“部署”,对工程与系统能力需求激增 [17]
西湖大学发布世界模型WorldForge,让普通视频模型秒变「世界引擎」
具身智能之心· 2025-09-24 08:04
文章核心观点 - 西湖大学AGI实验室的研究团队提出了一种名为WorldForge的全新免训练引导框架,旨在解决AI视频生成中可控性与生成质量难以兼得的瓶颈问题 [2][3] - 该框架通过在推理阶段对视频扩散模型进行“即插即用”式的干预,成功实现了从单张静态照片生成360°环绕视频以及对现有视频进行电影级复杂运镜等任务,无需重新训练模型 [3][6][13] 方法概述:免训练引导框架 - WorldForge的核心思想是在生成过程的每一步进行“干预”和“校准”,而非在训练阶段改造模型,通过用户定义的相机轨迹指令确保时空几何一致性 [13] - 框架包含三个关键创新模块:步内递归修正(IRR)、流门控潜在融合(FLF)和双路径自校正引导(DSG) [15][16][17] - **IRR模块**:通过步内递归优化机制,在每一步推理中先用真实内容替换模型预测的“已知区域”,以增量式校正来精准注入轨迹控制信号,防止轨迹漂移 [15] - **FLF模块**:在VAE潜在空间中,基于光流相似性区分“运动通道”与“外观通道”,仅向运动通道注入控制信号,实现动静分离以保护画面细节 [16] - **DSG策略**:利用IRR产生的“即兴创作”(非引导路径)和“精准描摹”(引导路径)两条并行路径,计算差异形成动态校正项,在轨迹精确性与画面质量间取得平衡 [17][18] 技术亮点与应用 - **单图生成360°环绕视图**:仅需一张静态照片,即可生成清晰、稳定、几何一致的360°环绕视频,尤其适合以目标为中心的复杂开放场景 [21] - **视频的电影级可控重摄影**:用户可为任意视频指定希区柯克变焦、弧形环绕、升降摇移等复杂相机轨迹,WorldForge能稳定“重拍”并自动补全新视角内容,在人脸、动态物体与复杂环境中表现更稳定 [23] - **视频内容的编辑与再创作**:框架支持视频去抖与视角切换、物体擦除与添加、主体变换与虚拟试穿等多种编辑功能,保持几何一致性与环境融合 [29] - **免训练特性带来的优势**:WorldForge无需训练,作为一个即插即用的模块可灵活迁移至多种主流视频模型,具有卓越的跨域适应性,同时因免去重训与数据筹备而成本友好,降低了高质量3D/4D内容的创作门槛 [31][34] 行业意义与展望 - WorldForge代表了一种新范式,即在不牺牲大模型先验知识、不增加训练成本的前提下,于推理阶段实现对生成过程的精准控制,证明视频模型不仅是内容“生成者”,也能成为听懂指令的“执行者” [32] - 该技术极大地降低了影视预览、游戏开发、数字孪生等领域的高质量3D/4D视觉内容创作门槛 [32] - 展望未来,若将这种精准的时空控制能力与更强的多模态理解(如语言、草图)相结合,有望实现通过口头描述或简单勾画就能导演AI生成的“时空大片”,为通往“可控世界模型”提供了一条前景光明的技术路径 [32]
VLA及其相关方向占据了顶会近一半的具身工作,特别是这几个......
具身智能之心· 2025-09-23 12:00
行业技术趋势:VLA成为具身智能关键驱动力 - 从今年各机器人与AI顶会来看,Vision-Language-Action模型及其相关衍生方向占据了近一半的具身智能产出,特别是在长程操作、泛化、少样本学习、VLA与强化学习结合以及人形机器人相关领域[1] - VLA模型打破了传统机器人方法的单任务局限,使机器人能在多样化场景中自主决策,灵活应对未见过的环境,广泛应用于制造业、物流和家庭服务等领域[1] - VLA模型已成为研究热点,推动了多个前沿项目的发展,如pi0、RT-2、OpenVLA、QUAR-VLA和HumanVLA,这些研究促进了学术界与工业界的合作[1][4] - VLA模型的适应性体现在能应用于机械臂、四足机器人和人形机器人等多种平台,为各类智能机器人的发展提供了广泛的潜力和实际应用价值[1] 产业发展与竞争格局 - 国内外具身智能领域正处于蓬勃发展阶段,Unitree、智元、星海图、银河通用、逐际动力等团队正从实验室走向商业化[3] - 华为、京东、腾讯等国内科技巨头积极布局具身智能领域,与国外的Tesla、Figure AI等公司共同推动该领域发展[3] 技术演进与核心挑战 - VLA范式是具身智能领域的新范式,能从给定的语言指令和视觉信号直接生成机器人可执行的动作,使机器人模型向更通用和泛化的方向发展[4] - 技术演进路径包括从早期的抓取位姿检测到行为克隆,再到近期的Diffusion Policy和多模态基础模型[7] - 前沿模型如RT-2、OpenVLA和PI0实现了从视觉输入和语言指令到机器人动作的端到端映射,应用于复杂任务规划和执行[7] - 领域面临的核心挑战包括跨域泛化、长期规划与世界模型构建[8] - 研究前沿包括将大型语言模型的推理能力与机器人控制系统结合,实现从高级任务描述到低级运动规划的有效转换,以及通过PaLM-E、RT-X等模型的多模态预训练和微调策略增强机器人在开放环境中的适应性和鲁棒性[8] - 前沿发展方向包括多模态感知融合、触觉反馈整合、基于物理的推理以及社会互动能力,旨在突破“看得见但摸不着”、“只关注当下不能预测未来”等局限性[8] 研究热点与未解难题 - 具身智能领域存在大量未解决的研究难点,包括长期记忆、VLA与强化学习结合的原子技能库构建、动作解码问题、多模态思维链等多个前沿方向[13] - VLA模型体系可系统梳理为隐式端到端、显式端到端、分层端到端三大类[9]
具身智能之心近20个交流群来啦!欢迎加入
具身智能之心· 2025-09-23 12:00
文章核心观点 - 成立具身智能之心技术交流群,旨在聚集行业专业人士共同承担具身智能领域未来领导者的角色 [1] 技术交流群定位与目标 - 交流群覆盖近20个具身智能子技术方向 [1] - 目标是与成员共同承担该领域未来领导者的角色 [1] 目标成员与研究方向 - 欢迎从事人形机器人、四足机器人、机械臂等本体研究的专业人士加入 [1] - 研究方向包括视觉语言导航、大模型、视觉语言交互、强化学习、移动操作、多模态感知、仿真、数据采集等 [1] 加入方式 - 可通过添加指定微信账号并备注“加群+昵称+研究方向”的方式申请加入 [1]