南方科技大学孟庆虎：马斯克关于“Optimus三年内做手术”的大饼烙不熟

行业技术现状与挑战 - 当前主流大模型（如ChatGPT、DeepSeek、Gemini、千问）本质上是“大语言模型”，在文本生成方面有突破，但在图像处理、三维空间理解和物理世界建模方面能力不足，“幻觉”现象突出 [2] - 人工智能模型目前更多基于二维基础模型，而人类认知记忆以三维世界为基础，这限制了其在复杂物理任务中的应用 [2] - 人形机器人在动作控制（如跑半马、走猫步、翻跟头、打太极）方面取得明显进步，但这些动作多为“预制程序”，且可能经历上百乃至上千次失败才成功一次，不代表综合能力 [3] 对特斯拉Optimus及外科手术能力的预测分歧 - 特斯拉CEO埃隆·马斯克预测，其旗下人形机器人Optimus将在三年内规模化地超越人类最好的外科医生 [1] - 南方科技大学教授孟庆虎对此提出否定看法，认为受数据、模型性能和硬件（尤其是精准度、灵巧手及反应）制约，三五年内不可能实现 [1][4] - 孟庆虎进一步指出，机器人实现成功进行手术的能力可能需要五年甚至十年时间，未来很可能由仿人形机器人结合医生专家的AI Agent共同完成 [4] 人工智能发展路径：场景智能 vs 通用智能 - 行业专家指出，人工智能当前缺乏自主行为和交互性这两个关键因素，具身智能发展仍有很大局限性 [3] - 提出应以“场景智能”替代“通用智能”作为落地路径，即针对特定应用场景，使用极小的算力、极简的算法和有限的数据高效解决问题，例如无线胶囊机器人使用消化道系统数据集检测异常 [3] - 通用人工智能（AGI）面临高质量有效数据不足的制约，在数据补齐之前，训练出的模型仍是低维且不通用的，因此应优先发展可立即解决具体问题的“场景智能” [4]