南方科技大学孟庆虎:马斯克关于“Optimus三年内做手术”的大饼烙不熟

行业技术现状与挑战 - 当前主流大模型(如ChatGPT、DeepSeek、Gemini、千问)本质上是“大语言模型”,在文本生成方面有突破,但在图像处理、三维空间理解和物理世界建模方面能力不足,“幻觉”现象突出 [2] - 人工智能模型目前更多基于二维基础模型,而人类认知记忆以三维世界为基础,这限制了其在复杂物理任务中的应用 [2] - 人形机器人在动作控制(如跑半马、走猫步、翻跟头、打太极)方面取得明显进步,但这些动作多为“预制程序”,且可能经历上百乃至上千次失败才成功一次,不代表综合能力 [3] 对特斯拉Optimus及外科手术能力的预测分歧 - 特斯拉CEO埃隆·马斯克预测,其旗下人形机器人Optimus将在三年内规模化地超越人类最好的外科医生 [1] - 南方科技大学教授孟庆虎对此提出否定看法,认为受数据、模型性能和硬件(尤其是精准度、灵巧手及反应)制约,三五年内不可能实现 [1][4] - 孟庆虎进一步指出,机器人实现成功进行手术的能力可能需要五年甚至十年时间,未来很可能由仿人形机器人结合医生专家的AI Agent共同完成 [4] 人工智能发展路径:场景智能 vs 通用智能 - 行业专家指出,人工智能当前缺乏自主行为和交互性这两个关键因素,具身智能发展仍有很大局限性 [3] - 提出应以“场景智能”替代“通用智能”作为落地路径,即针对特定应用场景,使用极小的算力、极简的算法和有限的数据高效解决问题,例如无线胶囊机器人使用消化道系统数据集检测异常 [3] - 通用人工智能(AGI)面临高质量有效数据不足的制约,在数据补齐之前,训练出的模型仍是低维且不通用的,因此应优先发展可立即解决具体问题的“场景智能” [4]