AI科研循环系统
搜索文档
卡帕西开源Agent自进化训练框架,5分钟一轮实验,48h内揽星9.5k
量子位· 2026-03-09 14:05
项目概述 - 大神Karpathy开源了一个名为“autoresearch”的AI科研循环系统项目,其核心是让智能体完全自主地进行科研工作[1][2] - 项目框架极其精简,总代码量仅为630行,且仅需单个GPU即可运行[3] - 项目发布不到两天,在GitHub上已获得超过9.5k星标,相关X帖子浏览量超过580万次[6][8] 核心原理与设计 - 项目核心思路是将AI训练中的循环试错过程自动化,实现“修改-训练-评估-决策”的自主循环[13] - 系统基于nanochat模型训练,并设定了两条核心规则:每次实验的纯训练时间固定为5分钟;评估指标仅使用`val_bpb`(数值越低代表模型效果越好)[15] - 整个代码库由三个核心文件驱动:`prepare.py`(定义训练常量与工具)、`train.py`(AI可修改的训练核心文件)、`program.md`(人类编写的指令文件)[17] 工作流程与效率 - 工作流程始于人类在`program.md`中编写指令,AI读取后对`train.py`进行针对性修改(通常每次1-2处),随后启动5分钟训练并依据`val_bpb`评分进行决策[29][30] - 若`val_bpb`分数降低(模型进步),则保留对`train.py`的修改作为下一次实验的基础;若分数升高,则回退到上一个最佳版本[30] - 该流程以5分钟为周期循环进行,理论上AI每小时可完成超过10组实验,效率远超人工[32] - 在一次近250轮的自主探索中,AI最终筛选并保留了29次有效的优化改进[33] 未来愿景与社区协作 - 项目未来目标是模拟整个博士生研究社群,实现大规模、分布式、异步的群体智慧探索,灵感来源于SETI@home项目[35][38] - 当前AI研究智能体受限于以单一master分支为核心的线性开发模式,限制了其潜力[39][41] - 未来的理想路径是让代码仓库像种子一样,向不同研究方向和计算平台伸展出无数分支,形成分布式探索态势[41] - 实验探索包括让智能体将研究成果发布在GitHub Discussion或通过PR提交精确commits,这些分支无需合并,可作为独立研究积累并相互启发[46][47][48] - 这旨在探索一种从“写软件”逻辑转向更灵活的“攒经验”逻辑的AI协作方式[49]