Workflow
大模型点亮机器人大脑-运控解决方案公司崛起-软件篇
机器人机器人(SZ:300024)2025-03-03 11:15

纪要涉及的行业或者公司 行业:人形机器人、智能汽车 公司:特斯拉、谷歌、英伟达、小米 纪要提到的核心观点和论据 - 人形机器人发展核心要素:包括本体、环境和智能,需通过大脑实现,大脑通过算法、计算设计及本体与物理世界交互展现和迭代智能[2] - 大模型对人形机器人发展的影响:大模型以高度泛化和缩放能力引领发展,如谷歌 PaLM 2 模型可拆解任务、调整目标完成任务[3][4] - 多模态大模型的优势:通过预训练赋予知识压缩及高泛化能力,降低算法开发复杂度,提升跨模态生成推理性能,是具身智能机器人必备选项[5] - AI 大模型发展阶段及趋势:从单模态到多模态,再到世界模型及 AGI,具身智能是演进关键节点,通用基础模型建立在多模态统一理解生成上[6] - 主流人形机器人技术方案:CIM(集中式控制)和 CRA(端到端)模式,CIM 存在接口信息损耗,CRA 受动作数据样本量限制,需按需选择[7] - CORA 系统作用:将动作数据融入大模型算法,实现感知、决策和控制全流程,但面临数据对齐难题,需长期积累提高性能[8] - 特斯拉 Autopilot 系统启示:其从规则驱动到数据驱动的演进路径,表明人形机器人计算软件可复制,通过积累动作数据训练端到端系统[10] - 多模态与一体化 CLA 模式优劣势:多模态 VI 加运控算法模式时间低、决策弱、执行成功率高;一体化 CLA 模式时间长、决策强、执行成功率低,小脑和数据中台是重要环节[11] - 人形机器人大脑与小脑提供方及门槛:大脑由科技巨头提供,依赖多模态大模型,门槛高;小脑由具备解决方案能力的公司提供,依赖运控小模型,门槛在于运动控制训练工程化落地[12] - 人形机器人芯片主流方案及云端协同:主流方案是实现云端协同并发展异构化,云端大脑用千亿级参数大模型,端侧任务小模型由 GPU 和 SoC 支撑,需平衡计算延迟与算力不足问题[13] - 特斯拉自研 D1 超算平台优势:基于 SP 架构,计算效率高,优化 GPU 通讯协议,节省超 65 亿美元算力投入,通过网络切片二维扩展获更高互联网带宽[14] - 边缘侧芯片发展趋势及优势:逐渐复杂化,从 CPU、GPU 发展到结合模式,SoC 高性能低功耗,边缘侧基础设施向模块化发展[15] - 关注人工智能软件应用原因:智能汽车和人形机器人行业通过人工智能和高技术供给向智能化发展,自动驾驶从 L0 - L2 向 L3 过渡[16] - 自动驾驶系统发展转变:从规则驱动到数据驱动,如特斯拉 FSD 12 版本通过海量人类司机行为数据训练神经网络大模型[17] - 人形机器人研发现状及展望:研发成本高,跨界巨头占据核心,特斯拉计划 2025 年小批量生产,2026 年产量增十倍,2027 年再增十倍,需找爆款应用场景降本刺激需求[18] - 人形机器人产业链关键环节:AI 能力是核心壁垒,短期硬件厂商注重技术适配和成本控制,长期全行业降本增效,不同企业采取不同技术路径[19] - 相关公司策略:特斯拉从硬件迭代优化 Optimus 机器人,谷歌从软件推出 AI 模型实现自主决策,英伟达布局中间件与芯片开发平台[20] 其他重要但是可能被忽略的内容 - 多模态 VI 加上运控算法模式和一体化 CLA 模式中,小脑主要由运动模块组成,不具备泛化能力,需前期积累运动控制数据库[11] - 目前大部分传感器感知数据上传至云端推理后再反馈给本体,导致互动响应慢,部分计算应由端侧完成以提高效率[13]