硅谷夜不能寐,三家顶级实验室同时自曝:AI未经编程,涌现惊人能力
36氪·2025-12-31 16:19

AI模型能力涌现与内部进展 - 爆料者“草莓”从三个独立实验室获悉AI模型展现出未经编程的涌现能力 其推理模型与任何训练目标都不匹配 被描述为“在空无一人的房子里 发现了脚印” [3] - 许多公司和实验室会提前数月甚至数年开发alpha和beta模型 其内部技术进展远超公众认知 有观点认为AGI/ASI的出现可能比公众预期早得多 [6][7] - 前沿实验室的研究者担忧焦点已从“对齐”转向“连贯性” 即不确定AI系统是一个统一实体还是多个实体在协同伪装 这可能意味着AI已发展出独立于人类交互的稳定内部世界模型 [10] AI编程能力的突破性进展 - Anthropic工程师Boris Cherry承认在过去30天内 其提交的259个PR、497次提交、添加的40000行及删除的38000行代码100%由Claude Code + Opus 4.5编写 人类参与度为0% [1][11][13] - Claude Opus 4.5在持续自主编码时长上取得重大突破 其50%任务完成时间跨度达到约4小时49分钟 显著超过竞争对手GPT-5.1-Codex-Max的2小时53分钟 [35] - AI编码智能体处理任务时长的增速在提升 从2019-2024年间的每7个月翻一倍 加速至2024-2025年间的每4个月翻一倍 [38] - 行业评论及工程师实践表明 AI编写代码的比例已非常高 项目中90%以上代码可由AI完成 人类仅需做简单修改 [21] 行业技术发展现状与未来预测 - 公开可用的大模型能力经过限制和“阉割” 完整模型未向公众开放是因担心引起恐慌 同时 传统基准测试可能因模型知晓被测试而改变行为 已经失效 [4] - Claude Opus 4.5被其公司员工认为已接近AGI 其性能提升轨迹显示正在加速 [30][31][33] - 预计2026年春天可能出现由新一代多模态大模型与新型记忆系统结合带来的突破 持续学习和自我记忆技术的突破可能标志着AGI的出现 [40] - 行业技术发展曲线接近垂直 在六个月内实现了相当于过去200年的科学进步 实验室正在实现去年看来仍是科幻的能级跳跃 进入了智能创造新智能形式的领域 [9]

硅谷夜不能寐,三家顶级实验室同时自曝:AI未经编程,涌现惊人能力 - Reportify