没有身体就没有AGI！Hillbot苏昊对谈千寻高阳：具身智能泡沫很大但进展真实

文章核心观点 - 具身智能是通往通用人工智能的必经之路，其本质与大语言模型无异，核心在于数据规模的扩展[2][3][4] - 行业正处于“全民做科研”的泡沫与真实进展并存阶段，技术突破是连续过程，机器人具身模型的GPT-3.5时刻预计在2-3年内到来[31][33][38][41] - 中国在具身智能领域具备硬件与软件协同设计、供应链效率和现实世界数据采集的显著结构性优势[25][26][27][30] 具身智能的战略重要性 - 具身智能是实现通用物理智能和通用智能的关键出口，缺乏身体则无法验证认知和改变世界[2][16][19] - 无论是虚拟智能体还是物理机器人，与环境的交互和经验学习是获得通用能力的必不可少环节[21][23] - 科学发现和拓展人类生存空间等宏大目标，均需具身智能实现感知与交互的配合[19] 技术路径与突破预期 - 技术路径借鉴大语言模型的成功经验，核心是解决预训练问题，让模型具备先验知识[39][40] - 世界模型是技术框架的重要组成部分，旨在建立对物理世界常识的表征，视觉-语言-动作架构需要其支撑[34][36] - 下一个突破是模型听话程度和完成多样化物理行为能力的连续提升，最终能串联复杂任务[40][41] - 机器人具身模型的GPT-3.5时刻预计还需2-3年，GPT-4时刻则需更长时间[41] 中美竞争与中国优势 - 中美在顶尖技术层面差距不大，美国在人才绝对数量和资本对“世界第一”量级的投入上具有优势[24][25] - 中国的核心优势在于硬件和软件的协同设计能力、供应链效率以及现实世界数据采集的迭代速度[25][26][27] - 硬件迭代周期在中国可比美国快3-10倍，配件获取速度以天为单位，而美国需周以上[25][26] - 中国全社会对具身智能的投入度和决心更强，且在该领域“没有退路”，必须持续支持[30] 行业现状与挑战 - 当前AI行业处于“全民做科研”状态，因问题宏大，资本和研究力量过早介入导致泡沫与真实进展并存[31][33] - 具身智能发展的最短板是数据，其瓶颈与大语言模型的电力瓶颈不同[27] - 芯片供应，特别是端上芯片，是中国面临的一个明确挑战[30]