Anthropic联创定下deadline:2028年AI实现自我进化,没有人类了
机器之心·2026-05-05 12:02

文章核心观点 - Anthropic联合创始人Jack Clark基于公开数据预测,到2028年底,AI系统实现递归自我改进(即自主构建和改进自身)的概率约为60% [2][18] - 其核心论据是AI在研发相关任务上的能力正快速进步,已能自动化AI工程中的大部分环节,并逐步具备端到端自动化AI研发的潜力 [10][20][75] - 尽管AI在提出革命性新思想方面仍有不足,但其在自动化“苦活累活”和串联复杂任务方面的进展,已足以推动自身渐进式发展 [60][68][69] AI研发自动化进展与证据 编码能力 - AI系统解决真实世界软件工程问题的能力飞速提升:SWE-Bench基准测试中,最佳模型成功率从2023年底的约2%(Claude 2)跃升至93.9%(Claude Mythos Preview)[24] - AI系统能独立处理的任务时长显著增长:从2022年GPT-3.5的约30秒,提升至2026年Opus 4.6的约12小时,这使其能覆盖大量AI研发中的小时级任务 [29][30][31] - 编码代理(agentic coding)工具的爆发,使AI能在更长时间内相对独立地推进任务,工程师正将越来越复杂的工作委托给AI [28][33] 核心科学技能 - 复现研究结果:在CORE-Bench基准上,最佳模型成绩从2024年9月的约21.5%(GPT-4o)提升至2025年12月的95.5%(Opus 4.5),表明AI已能有效复现论文实验 [37][38] - 构建机器学习系统:在MLE-Bench基准上,最佳系统得分从2024年10月的16.9%(o1模型)提升至2026年2月的64.4%(Gemini 3),显示AI构建完整ML应用的能力 [41][42] - 内核(Kernel)优化:这是决定AI训练和推理效率的核心工程任务,已成为AI驱动研发的热门领域,具备结果易验证等适合自动化的属性 [43][46] - 模型微调:在PostTrainBench测试中,AI系统对小型开源模型进行后训练,能获得约人类训练结果一半的性能提升(AI得分25%-28%,人类基线为51%)[48][50] 管理与元技能 - AI系统正学习管理其他AI系统,例如在Claude Code等产品中,主代理可监督多个子代理,形成能处理更大规模项目的“合成团队” [56][57][78] - 在优化语言模型训练任务中,AI实现的平均加速倍数进展显著:从2025年5月的2.9倍(Claude Opus 4)提升至2026年4月的52倍(Claude Mythos Preview),远超人类研究员通常所需的4-8小时工作才能实现的4倍加速 [52][55][63] 对AI研发本质与未来路径的研判 - AI领域的进步更多依赖扩大规模(数据、算力)和扎实的工程调试,而非频繁的革命性洞见,这使擅长执行模式化任务的AI系统有能力推动领域渐进发展 [61][64][67] - 已有初步迹象显示AI能推动特定科学前沿(如数学、计算机科学),例如基于Gemini的系统解决了开放的Erdős数学问题,但这可能仅限于特别适合AI的领域 [72][73][74] - 主要AI公司已将自动化AI研发列为明确目标,例如OpenAI计划在2026年9月前构建自动化AI研究实习生,Anthropic在研究自动化AI对齐,创业公司Recursive Superintelligence为此融资5亿美元 [77][79][80] 潜在影响与行业动向 - AI研发自动化将带来巨大的生产力倍增效应,并可能催生资本密集、人力依赖度低的新型公司和经济形态 [83] - 数千亿美元级别的资本正投入以自动化AI研发为目标的机构,行业预期该方向至少会取得某种程度的进展 [80][81] - 作者将2027年底实现递归自我改进的概率预估为30%,到2028年底升至60%,若未实现则可能揭示当前技术范式的根本缺陷 [85][86]

Anthropic联创定下deadline:2028年AI实现自我进化,没有人类了 - Reportify