纪要涉及的行业或者公司 - 行业:人形机器人行业 - 公司:特斯拉、奥飞娱乐、凌云光 纪要提到的核心观点和论据 - 语言大模型在具身智能中的作用:语言大模型(LLM)在具身智能中作为任务规划器,因其强大认知推理能力可拆解和规划复杂任务,如指示机器人递橘子,LLM能将任务拆解为导航、定位、抓取等步骤,结合视觉和命令实现精细规划,在机器人领域作顶层规划器,通过互联网大规模数据训练,蕴含理解世界的常识和思维逻辑[3] - 具身智能系统中大脑与小脑的角色:大脑负责思维决策和动作规划,小脑负责将规划转化为具体执行,如拿起物体时,大脑知道要拿,小脑负责夹爪或五指灵巧手关节旋转角度、移动速度等细节,目前小脑操作能力是限制因素,需大量训练数据提升精确度[2][3] - 提升机器人小脑操作能力的方法:可利用互联网数据、仿真平台和真实数据,真实数据质量最高,仿真数据次之,互联网数据数量多但效果差,特斯拉通过大量真实训练数据提升机器人运动控制能力,记录关节运动数据实现精准控制[2][4] - DeepSeek开源的影响及未来发展方向:DeepSeek开源解决不同团队机器人大脑水平参差不齐问题,使更多团队提升大脑水平,未来精力将集中于提高小脑操作能力,高质量数据训练是关键,2025年特斯拉计划生产1万台用于厂内训练的人形机器人,体现高效训练方法和提高机器人实际操作能力的重要性[2][5] - 特斯拉在机器人数据收集和训练方面的计划:2025年部署1万台机器人,配备动捕设备,每个动捕设备需三名动捕人员三班倒操作,未来3万人参与数据提取工作,数据收集量将大幅增加,远超全球各大学和科研团队公开数据集,且采用五指灵巧手收集数据,与主要用两指夹爪的数据集有显著区别[2][5] - 动作捕捉技术对特斯拉机器人发展的重要性:动作捕捉技术是创造高质量数据的核心,2026年能否成功商业化取决于2025年是否积累足够且高质量的数据,这些数据对大模型实现泛化至关重要,目前任务规划层面泛化已实现,但动作规划层面的scaling law未确定,2025年的数据收集和训练决定2026年商业化前景[2][7] - 未来几年特斯拉机器人的发展目标:2025年部署1万台机器人,主要是成本投入;2026年若能实现商业化跳跃,将带动其他机器人制造商跟进,若特斯拉不开源数据,对其他公司构成巨大挑战[7] - 动作捕捉技术的路线和标的:动作捕捉技术主要有惯性动捕(IMU)和光学动捕(摄像头)两条路线,光学动捕精度高但易受遮挡影响,惯性动捕精度稍低但效果更好,有人提出惯性与光学互补方法规避缺点,奥飞娱乐旗下诺伊腾在国内排名靠前,凌云光推出光学动捕设备,值得关注[2][8] 其他重要但是可能被忽略的内容 - DeepSeek通过改良大模型架构和工程优化,大幅减少训练和推理所需算力,输出效果比之前大模型显著提升,是开源模型,在端侧应用受广泛关注,业界对其在超大规模模型中的应用期望高,有许多知名团队在进行相关研究[2]
探讨DeepSeek对人形机器人行业的影响