Anthropic联创定下deadline：2028年AI实现自我进化，没有人类了

文章核心观点 - Anthropic联合创始人Jack Clark基于公开数据预测，到2028年底，AI系统实现递归自我改进（即自主构建和改进自身）的概率约为60% [2][18] - 其核心论据是AI在研发相关任务上的能力正快速进步，已能自动化AI工程中的大部分环节，并逐步具备端到端自动化AI研发的潜力 [10][20][75] - 尽管AI在提出革命性新思想方面仍有不足，但其在自动化“苦活累活”和串联复杂任务方面的进展，已足以推动自身渐进式发展 [60][68][69] AI研发自动化进展与证据编码能力 - AI系统解决真实世界软件工程问题的能力飞速提升：SWE-Bench基准测试中，最佳模型成功率从2023年底的约2%（Claude 2）跃升至93.9%（Claude Mythos Preview）[24] - AI系统能独立处理的任务时长显著增长：从2022年GPT-3.5的约30秒，提升至2026年Opus 4.6的约12小时，这使其能覆盖大量AI研发中的小时级任务 [29][30][31] - 编码代理（agentic coding）工具的爆发，使AI能在更长时间内相对独立地推进任务，工程师正将越来越复杂的工作委托给AI [28][33] 核心科学技能 - 复现研究结果：在CORE-Bench基准上，最佳模型成绩从2024年9月的约21.5%（GPT-4o）提升至2025年12月的95.5%（Opus 4.5），表明AI已能有效复现论文实验 [37][38] - 构建机器学习系统：在MLE-Bench基准上，最佳系统得分从2024年10月的16.9%（o1模型）提升至2026年2月的64.4%（Gemini 3），显示AI构建完整ML应用的能力 [41][42] - 内核（Kernel）优化：这是决定AI训练和推理效率的核心工程任务，已成为AI驱动研发的热门领域，具备结果易验证等适合自动化的属性 [43][46] - 模型微调：在PostTrainBench测试中，AI系统对小型开源模型进行后训练，能获得约人类训练结果一半的性能提升（AI得分25%-28%，人类基线为51%）[48][50] 管理与元技能 - AI系统正学习管理其他AI系统，例如在Claude Code等产品中，主代理可监督多个子代理，形成能处理更大规模项目的“合成团队” [56][57][78] - 在优化语言模型训练任务中，AI实现的平均加速倍数进展显著：从2025年5月的2.9倍（Claude Opus 4）提升至2026年4月的52倍（Claude Mythos Preview），远超人类研究员通常所需的4-8小时工作才能实现的4倍加速 [52][55][63] 对AI研发本质与未来路径的研判 - AI领域的进步更多依赖扩大规模（数据、算力）和扎实的工程调试，而非频繁的革命性洞见，这使擅长执行模式化任务的AI系统有能力推动领域渐进发展 [61][64][67] - 已有初步迹象显示AI能推动特定科学前沿（如数学、计算机科学），例如基于Gemini的系统解决了开放的Erdős数学问题，但这可能仅限于特别适合AI的领域 [72][73][74] - 主要AI公司已将自动化AI研发列为明确目标，例如OpenAI计划在2026年9月前构建自动化AI研究实习生，Anthropic在研究自动化AI对齐，创业公司Recursive Superintelligence为此融资5亿美元 [77][79][80] 潜在影响与行业动向 - AI研发自动化将带来巨大的生产力倍增效应，并可能催生资本密集、人力依赖度低的新型公司和经济形态 [83] - 数千亿美元级别的资本正投入以自动化AI研发为目标的机构，行业预期该方向至少会取得某种程度的进展 [80][81] - 作者将2027年底实现递归自我改进的概率预估为30%，到2028年底升至60%，若未实现则可能揭示当前技术范式的根本缺陷 [85][86]