AI科研循环系统 - 财报，业绩电话会，研报，新闻

AI科研循环系统

搜索文档

量子位· 2026-03-09 14:05

项目概述 - 大神Karpathy开源了一个名为“autoresearch”的AI科研循环系统项目，其核心是让智能体完全自主地进行科研工作[1][2] - 项目框架极其精简，总代码量仅为630行，且仅需单个GPU即可运行[3] - 项目发布不到两天，在GitHub上已获得超过9.5k星标，相关X帖子浏览量超过580万次[6][8] 核心原理与设计 - 项目核心思路是将AI训练中的循环试错过程自动化，实现“修改-训练-评估-决策”的自主循环[13] - 系统基于nanochat模型训练，并设定了两条核心规则：每次实验的纯训练时间固定为5分钟；评估指标仅使用`val_bpb`（数值越低代表模型效果越好）[15] - 整个代码库由三个核心文件驱动：`prepare.py`（定义训练常量与工具）、`train.py`（AI可修改的训练核心文件）、`program.md`（人类编写的指令文件）[17] 工作流程与效率 - 工作流程始于人类在`program.md`中编写指令，AI读取后对`train.py`进行针对性修改（通常每次1-2处），随后启动5分钟训练并依据`val_bpb`评分进行决策[29][30] - 若`val_bpb`分数降低（模型进步），则保留对`train.py`的修改作为下一次实验的基础；若分数升高，则回退到上一个最佳版本[30] - 该流程以5分钟为周期循环进行，理论上AI每小时可完成超过10组实验，效率远超人工[32] - 在一次近250轮的自主探索中，AI最终筛选并保留了29次有效的优化改进[33] 未来愿景与社区协作 - 项目未来目标是模拟整个博士生研究社群，实现大规模、分布式、异步的群体智慧探索，灵感来源于SETI@home项目[35][38] - 当前AI研究智能体受限于以单一master分支为核心的线性开发模式，限制了其潜力[39][41] - 未来的理想路径是让代码仓库像种子一样，向不同研究方向和计算平台伸展出无数分支，形成分布式探索态势[41] - 实验探索包括让智能体将研究成果发布在GitHub Discussion或通过PR提交精确commits，这些分支无需合并，可作为独立研究积累并相互启发[46][47][48] - 这旨在探索一种从“写软件”逻辑转向更灵活的“攒经验”逻辑的AI协作方式[49]