大佬开炮：智能体都在装样子，强化学习很糟糕，AGI 十年也出不来

文章核心观点 - AI行业存在过度夸大和脱离实际的现状，AGI的实现仍需约十年时间，其发展将带来每年约2%的GDP增量，但并非以当前主流预期的方式实现[2][3][5][6][10][12][13] AGI发展时间与瓶颈 - AGI的实现预计需要十年时间，当前AI智能体存在认知缺陷，包括不够聪明、缺乏多模态能力、无法进行计算机操作、缺乏持续学习能力等[12][13] - 行业曾过早尝试完整解决方案，如雅达利深度强化学习和OpenAI的Universe项目，但因缺乏足够的表征能力而失败[16][17][18] - 预测未来算法将与当前有所不同，但核心仍将是通过梯度下降训练的大型神经网络，需在架构、优化器、损失函数等方面全面改进[33][34][35] LLM认知缺陷与学习机制 - 大语言模型存在认知缺陷，不擅长编写独特或智力密集型代码，容易误解代码风格并增加不必要的复杂性[40][41][42][43] - 模型记忆能力过强，但缺乏类似人类的反思、知识提炼和合成数据生成过程，导致其输出多样性不足且容易发生模型崩溃[60][61][62][63][67] - 人类学习通过内置硬件和进化编码的算法进行，而LLM通过模仿互联网文档训练，是两种不同的智能路径[19][20][22][23] 强化学习局限性 - 强化学习存在显著缺陷，其通过最终结果奖励整个过程的机制噪音过大，无法有效分配部分信用[50][51][52] - 基于过程的监督虽为替代方案，但自动化分配信用困难，且易受对抗性示例影响，导致模型找到漏洞欺骗评判系统[54][55][56][58] - 人类不使用强化学习进行智能任务，而是通过更复杂的回顾和思考过程，当前LLM缺乏相应机制[21][50][52] 自动驾驶与教育应用挑战 - 自动驾驶实现需要较长时间，因涉及复杂物理世界交互，其难度远高于纯数字知识工作[6][10] - 教育的未来可能涉及AI辅助，但需解决模型当前认知缺陷，如持续学习、知识提炼和长上下文处理等[6][10][31][32] 智能进化与经济影响 - 智能进化类似计算趋势的延伸，超级智能将是社会自动化的进步，逐步承担数字和体力工作[94][95] - AGI对经济的影响主要体现在自动化知识工作，预计可覆盖10%到20%的经济份额，但需考虑社会任务重构和工作界面变化[83][84][85] - AI当前最成熟的应用在编程领域，因代码高度结构化且具备相应基础设施，其他文本处理任务如内容重写等仍面临挑战[88][89][90][92]