Workflow
Embodied intelligence
icon
搜索文档
2025秋招开始了,这一段时间有些迷茫。。。
自动驾驶之心· 2025-07-08 15:53
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 2025年的秋招已经开始了,不少双非的同学都很迷茫。。。 目前在实验室做的工作有些落伍,现在无论是自动驾驶还是具身智能公司都需要实力比较强、背景比较好的同 学。 以下是 知识星球 内部一位双非同学的提问,非常具有代表性: 各位大佬们好,我目前是一个双非的研究生,研究方向是多传感器融合定位的,然后学过python、深度学 习、ros等等,但都学的不是很精,现在想多学一点为以后找工作用,感觉算法岗我的学历可能不太行,请 问各位大佬们我应该往哪个方向学比较好呢?学些什么知识呢? 星主回答:你的技术栈都比较偏机器人一些,SLAM和ROS这块都可以尝试一下和机器人/具身智能打交道。这 块需求也比较大,可以做一些优化、集成类工作~ 另一方面,我们了解到大一些的公司各家的hc都不是很多,要求基本上都是端到端、大模型、VLA、强化学 习、3DGS这些比较前沿的方向。如果你做的是这块,是有机会的,很多tire 1的公司或者主机厂也正在follow前 沿的技术,大概是从无图往端到端转,差不多技术栈推迟1-2代。像LV融合、无图、 ...
MuJoCo具身智能实战:从零基础到强化学习与Sim2Real
具身智能之心· 2025-07-07 17:20
在近20年AI发展的路线上,我们正站在⼀个前所未有的转折点。从早期的符号推理到深度学习的突破,再 到如今⼤语⾔模型的惊艳表现, AI 技术的每⼀次⻜跃都在重新定义着⼈类与机器的关系。⽽如今,具身智 能正在全面崛起。 MuJoCo ( Multi-Joint dynamics with Contact )不仅仅是⼀个物理仿真引擎,它更是连接虚拟世界与现实世 界的重要桥梁。在具身智能的技术⽣态中, MuJoCo 扮演着⾄关重要的⻆⾊,它为机器⼈学习提供了⼀个 ⾼保真、⾼效率的训练环境。 当我们谈论机器⼈学习时,⼀个核⼼问题是:如何让机器⼈在不损坏昂贵硬件的情况下,快速掌握复杂的 运动技能?传统的⽅法是在真实机器⼈上进⾏⼤量试错,但这种⽅式不仅成本⾼昂,⽽且效率低下,甚⾄ 可能存在安全⻛险。MuJoCo的出现彻底改变了这⼀现状。 通过 MuJoCo ,研究者可以构建⾼度逼真的虚拟机器⼈和环境,让 AI 系统在仿真中进⾏数百万次的试验 和学习。这种⽅法的优势是显⽽易⻅的:⾸先,仿真速度可以⽐现实时间快数百倍,⼤⼤加速了学习 过 程;其次,在虚拟环境中,机器⼈可以尝试各种极端情况⽽不⽤担⼼硬件损坏;最重要的是,通过精⼼ ...
研选 | 光大研究每周重点报告20250628-20250704
光大证券研究· 2025-07-04 22:17
越疆投资价值分析 - 全球协作机器人龙头地位,商业化能力有望持续验证 [3] - 技术壁垒全球领先,全栈自研构筑护城河,为后续发展及降本奠定基础 [3] - 全球化布局成效显著,受益制造业转移红利 [3] - 积极切入具身智能及人形机器人行业,打开长期成长空间 [3] 行业与公司研究 - 市场观点纷繁芜杂,研究聚焦总量、行业及公司领域,筛选有价值信息 [2] - 越疆(2432 HK)作为全球协作机器人龙头厂商,加速实现具身智能商业化 [3]
李飞飞最新对话
投资界· 2025-07-04 20:05
李飞飞对AGI与空间智能的核心观点 - 空间智能是实现通用人工智能(AGI)不可或缺的组成部分 没有空间智能 AGI就不完整 [1][4][29][33] - 3D世界建模是人工智能领域最基础且最具挑战性的问题之一 包括理解三维世界 生成三维世界 推理三维世界和在三维世界中行动 [7][8][33] - 创建超越平面像素 跨越语言障碍 真正捕捉三维世界结构和空间智能的世界模型是当前AI研究的终极目标之一 [9][33] ImageNet项目的历史意义 - ImageNet项目始于2007年 旨在通过互联网下载十亿张图片并创建视觉分类体系 为机器学习提供数据基础 [17][18] - 该项目包含14,197,122张图片和21,841个synsets索引 为计算机视觉研究建立了标准化数据集 [20] - 2012年AlexNet在ImageNet挑战赛中取得突破性进展 识别错误率从30%大幅下降 标志着数据 GPU和神经网络首次成功结合 [22][23][24] 计算机视觉的发展历程 - 从物体识别(如ImageNet解决的"识别猫或椅子")发展到场景描述 再扩展到三维世界理解 是计算机视觉研究的自然演进 [25][26][30] - 2015年左右 图像字幕生成技术取得重大突破 为后来的生成式AI发展奠定了基础 [27] - 视觉智能的进化历史长达5.4亿年 远比语言进化(3-5亿年)更复杂 这解释了为什么空间智能研究更具挑战性 [32][33] 空间智能研究的挑战 - 空间智能面临数据严重缺失的问题 与语言数据不同 三维世界的信息主要存在于人类大脑中 难以直接获取 [36] - 3D建模的数学复杂度远高于一维语言处理 需要将2D投影反向推导为3D结构 并遵守物理规律 [34][35] - 人类视觉皮层处理数据的神经元数量远超语言处理区域 这暗示了空间智能模型的架构可能需要与LLMs完全不同 [37][38] World Labs的研究方向 - 公司专注于解决空间智能这一AI领域最困难的问题 正在构建能够输出3D世界的基础模型 [31][40][41] - 研究团队由多位顶尖专家组成 包括Pulsar创造者 Justin Johnson和Nerf作者等 [34] - 应用场景涵盖设计 建筑 游戏开发 机器人学习以及元宇宙内容生成等多个领域 [41][42][44] 行业研究方法论 - 数据驱动方法需要与高质量数据并重 避免"输入垃圾输出垃圾"的问题 [73] - 鼓励跨学科研究 特别是在科学发现领域与AI的结合 [60] - 小数据研究和理论突破是学术界在资源受限情况下的重要方向 [61][62]
自动驾驶论文速递 | 世界模型、VLA综述、端到端等
自动驾驶之心· 2025-07-02 15:34
世界模型Epona - 地平线、清华、北大等团队在ICCV'25中稿的自回归扩散世界模型工作,可以不依赖视频预测独立输出轨迹规划 [2] - 算法框架采用自回归扩散模型,实现长时间生成和实时轨迹规划 [3] - 实验结果:FID T为7.5,FVD T为82.8,最大持续时间达120秒/600帧,显著优于对比模型DriveGAN、DriveDreamer等 [5] - 核心优势:实现2分钟长时间生成,20Hz实时轨迹规划,连续视觉标记器保留丰富场景细节 [6] 视觉-语言-动作模型综述 - 麦吉尔大学、小米等团队发布VLA模型综述,涵盖DriveGPT-4、ADriver-I等15种模型 [13] - 模型对比表显示:输入类型包括单/多模态,数据集涵盖BDD-X、nuScenes等,输出包含轨迹规划(LLC/Traj) [18] - 最新模型如OpenDriveVLA(2025)支持2D/3D对齐,ORION(2025)实现连续动作推理 [18] StyleDrive基准测试 - 清华AIR等团队提出驾驶风格感知的端到端自动驾驶评测框架 [20] - 基于规则的驾驶风格分类标准覆盖10种交通场景,包括车道跟随、交叉路口等场景的动态特征 [22] - 实验结果:DiffusionDrive-Style模型表现最佳,SM-PDMS达84.10,优于TransFuser(81.09)和WoTE(81.38) [23] 技术社区推广 - 知识星球提供自动驾驶全栈学习路线图、硬件/代码资料及行业招聘信息 [9] - 社区目标3年内建成万人规模,已吸引华为天才少年等专家加入,形成"课程+硬件+问答"闭环 [25]
同样的idea别人中了CVPR,你的却被秒拒?
自动驾驶之心· 2025-07-02 10:05
论文辅导服务核心观点 - 顶会论文需具备广泛适用性而非单一场景解决方案 强调方法论的系统性和可扩展性 [1] - 论文实现难度与创新性需平衡 从实验设计到写作各环节均影响投稿区位 [2] - 提供全流程深度辅导 覆盖计算机全领域及AI4S领域 目标直指顶会录用 [2][5][10] 服务内容与优势 辅导模式 - 采用1对1保姆式服务 从idea生成到最终发表全程跟进 [3][5] - 导师团队协助解决数据问题 针对性指导实验设计与模型优化 [4][5] - 搭建论文写作框架 提供增删改查支持 强化薄弱环节 [5] 师资力量 - 拥有300+专职AI方向导师 均来自QS前100高校 具备顶会/子刊发表经验 [7][8] - 覆盖自动驾驶 具身智能 机器人等交叉学科 近3年辅导学员400+ 中稿率96% [7][8] 领域覆盖 - 计算机全领域支持 包括大模型 VLA 端到端自动驾驶等25+细分方向 [9][10] - 可辅导CCF-A/B/C类会议及TPAMI CVPR等顶刊 含SCI1-4区期刊 [10] 目标用户群体 - 缺乏中稿经验的研究生/本科生 需突破科研瓶颈的硕博生 [5] - 计划转自动驾驶方向或申博评职的CS领域研究者 [5] - 需快速掌握前沿技术方法论 提升论文国际认可度的学者 [5][11] 行业竞争力 - 背靠国内最大AI技术自媒体平台 拥有顶尖学术资源网络 [7] - 专注自动驾驶等前沿交叉学科 深度理解领域痛点与机遇 [7][8] - 强调时效性服务 帮助用户快速应对热门研究方向迭代 [11][12]
上岸小厂,心满意足了。。。
自动驾驶之心· 2025-07-01 12:04
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 这几年以自动驾驶和具身智能为主线的AI技术不断突破,撑起了近一半的技术路线和融资金额。但是自 动驾驶行业趋于饱和,有不少同学去年校招的时候几近崩溃,十月份了还没有offer。 好在最后 还是坚持 下来了,虽然拿到小厂offer,结果还是满意的。 从L2~L4自动驾驶功能的不断量产到人形机器人完成跳舞、四足机械狗在沙漠与丛林跳跃。很幸运能够 完整的经历这一发展周期,我们非常清晰行业对技术和人才的需求。 做了3年多的技术自媒体,在自驾、具身智能、3D视觉、机器人领域,我们沉淀了大量的内容。但后期陆 续收到了许多同学关于就业的求助,谈薪、避坑、职位选择、跨行等都是大家很关注的问题。我们一直 想给大家这样一个平台,让需要就业的同学能够快速匹配到自己的岗位,事半功倍!近半年的筹划,我 们推出了AutoRobo知识星球,一个覆盖机器人、自动驾驶、具身智能方向的求职社区! AutoRobo知识星球 这是一个给自动驾驶、具身智能、机器人方向同学求职交流的地方,目前近1000名成员了,成员范围包 含已经工作的社招同学,如地平线 ...
1.5m/s极速+50kg负载!大象机器人新底盘卷翻机器人开发圈
机器人大讲堂· 2025-07-01 10:39
在人工智能与机器人技术加速迭代的当下,自动驾驶算法正从虚拟测试走向真实道路与物流运输场景落地,专 业级机械臂也逐渐成为课堂示教编程的得力助手。随着行业发展,传统基础编程实践已难以满足需求,科研人 员与开发者更热衷于在仿真环境中钻研多机协同算法等前沿课题;与此同时,实验室对机器人在模拟场景下, 实现测试识别、精准抓取、智能避障、高效搬运全链路流程的要求也水涨船高。 在一背景下, 大象机器人于近日推出移动复合机器人 myAGV Pro, 为智能机器人领域的探索与实践带来新 的解决方案。 据机器人大讲堂了解,myAGV Pro是 大象机器人 旗下的 全向转向系统小车 ,适配大象机器人旗下轻量化 协作机械臂生态和市面上大部分通用协作机器人,能够完成 多目标环境检测、语音语义识别 等人工智能的相 关应用。大象机器人推出该产品主要旨在为研究人员与开发者在智能机器人领域进行 仓储搬运、教学学习、 创新应用、科研研究和竞技比赛 等场景提供理想平台。 myAGV Pro 中文宣传片 3 丰富生态,支持二次开发 原 生 搭 载 Ubuntu 22.04 , 提 供 RVIZ 、 Gazebo 仿 真 环 境 支 持 。 同 时 ...
中国民营经济组织达1.85亿户 市场主体活力持续增强
长江商报· 2025-06-30 16:29
民营经济总体发展 - 截至2025年5月底全国实有民营经济组织1.85亿户占经营主体总量的96.76%同比增长2.3% [2] - 私营企业与个体工商户构成民营经济"双引擎"私营企业数量超5800万户同比增长5.2%个体工商户达1.27亿户同比增长1.0% [2][3] 私营企业发展动态 - 私营企业在新能源高端装备制造等战略性新兴产业持续发力光伏产业中民营企业占全球组件供应量80%以上新能源汽车领域民营车企销量占比超70% [3] - 华为2024年研发费用支出1797亿元占收入20.8%近十年累计研发投入超12490亿元全球有效授权专利超15万件 [3][4] - 比亚迪2024年新能源汽车销量超425万辆同比增41.1%其中纯电车型占比41.5%插混车型占比58.5%同时斩获中国车企销量冠军及全球新能源车销量冠军 [4] - 私营企业贡献全国70%以上技术创新成果80%以上专精特新"小巨人"企业来自民营经济 [4] 个体工商户发展特征 - 个体工商户广泛活跃于社区零售餐饮服务家政维修等领域通过数字化工具实现线上线下融合经营 [5] - 每户个体工商户平均带动就业超2人全国个体工商户合计提供超2.5亿个就业岗位 [6] - 政策层面通过税费减免金融支持等措施助力个体工商户发展并推动其参与街区改造特色街区打造等区域经济活化项目 [6] 细分领域创新案例 - 黑芝麻智能在2025上海车展发布华山A2000系列芯片Pro版单颗算力超越4颗行业旗舰芯片 [4] - 家政维修行业个体从业者通过技能培训与服务标准化提升借助平台认证提升市场信任度 [6]
双非研究生,今年找工作有些迷茫。。。
自动驾驶之心· 2025-06-30 13:51
自动驾驶与具身智能行业趋势 - 自动驾驶和具身智能公司对人才要求较高,倾向于招聘实力强、背景好的同学[2] - 行业技术方向正从传统方法向端到端、大模型、VLA、强化学习、3DGS等前沿领域转型[3] - 机器人初创公司融资活跃,未来几年发展前景可观[3] 职业发展建议 - 双非背景同学可考虑SLAM和ROS方向,从事机器人/具身智能相关的优化、集成类工作[3] - 建议关注机器人公司,虽然工作较苦但能学习到实打实的技术栈[4] - 具身智能是最前沿方向,但传统机器人仍是产品主线[4] 技术社区资源 - 知识星球提供自动驾驶视频课程、硬件及代码学习资料,以及全栈学习路线图和招聘信息[5] - 社区已形成学术+产品+招聘的完整链路,包含课程、硬件和问答闭环[5] - 社区关注行业技术动态、技术分享、讨论和求职信息,聚焦具身智能与自动驾驶结合等前沿话题[5] 前沿技术方向 - 四大前沿技术方向包括视觉大语言模型、世界模型、扩散模型和端到端自动驾驶[7] - 视觉大语言模型领域有多篇CVPR 2024论文,涉及预训练、迁移学习等方向[11][12] - 扩散模型在自动驾驶中的应用包括场景生成、数据增强等方向[38][39] 数据集资源 - VLM预训练数据集规模从百万级到百亿级不等,最大达12B样本[15] - 自动驾驶数据集涵盖2D/3D目标检测、语义分割、目标跟踪等任务,时间跨度从2009到2024年[21] - 语言增强的自动驾驶数据集支持文本解释、视觉问答等任务[22] 应用领域进展 - 智能交通领域主要研究语言引导的车辆检索和视觉问答技术[23] - 自动驾驶感知方向聚焦行人检测、目标指代等任务[24] - 定位规划领域探索语言引导导航和运动规划技术[25] - 决策控制方向研究大语言模型在自动驾驶决策中的应用[26] 端到端自动驾驶 - 端到端方法整合感知、预测和规划模块,实现自动驾驶全流程[27] - 相关研究关注模型可解释性、行为规划和场景生成等方向[45] - 世界模型在端到端驾驶中发挥重要作用,支持场景理解和生成[30][50]