以Agent为核心的软件生产方式
搜索文档
Andrej Karpathy最新播客:Token没用完让人焦虑,就像患上「AI精神病」
机器之心· 2026-03-22 09:17
文章核心观点 - AI领域正在经历一场以Agent为核心的生产方式重构,软件工程师的工作方式已发生根本性转变,从主要自己写代码变为主要驱动Agent执行任务[9][10] - 未来的软件与商业体系将围绕Agent进行重构,App可能消失,设备只需开放API,由Agent作为新的“操作系统”统一调度[3] - 行业需要为人类与AI构建更广阔的协作界面,并探索如何将研究人员从循环中移除,实现自动化研究以最大化效率[43][44][51] 工作范式转变与个人体验 - 资深专家的工作方式从去年12月起发生剧变,从80%自己写代码、20%交给Agent,转变为20%自己写代码、80%交给Agent,目前甚至已远超此比例[9] - 专家已近半年未手写一行代码,每天工作16小时与Agent对话,并行驱动十多个任务,并因未将token吞吐量用到最大而感到焦虑[3][9][20] - 工作瓶颈从个人打字和编码效率,转变为个人组织、调度多个Agent协同工作的能力,思考单元从代码行变为“宏操作”[12][16] Agent作为新操作系统与软件生态重构 - 未来设备只需开放API,Agent将成为新的“操作系统”,统一控制智能家居等各类设备,例如通过三段提示词在WhatsApp对话中控制全屋设备[3] - 大量定制化、碎片化的App是被过度生产的,未来能力应以API形式暴露,由Agent作为智能胶水层进行调用和组合[38][39] - 未来的用户将不再是人类,而是代表人类行动的Agent,整个软件与商业体系都必须围绕此进行大规模重构[4][40] 自动化研究与提升杠杆率 - 发挥AI工具最大价值的关键是将人类从系统瓶颈中移除,实现完全自动运行,核心目标是最大化无人类参与的token吞吐量[43][44] - 自动化研究是此理念的体现,给定目标、评估指标和边界条件后,系统可自行探索优化,甚至在已调优的模型上发现新的改进点[47][48] - 研究机构可被定义为一组markdown文件(角色、流程),这些“代码”可以被持续优化,存在对研究组织本身进行元优化的空间[4][51][52] AI能力的不均匀性与未来分化 - AI能力存在不均匀性,在可验证、被重点优化的领域(如代码生成)表现强大,但在未被强化的领域(如讲笑话)进步缓慢[57][59][60] - 当前主流是追求覆盖所有能力的单一模型,但未来应出现更多针对特定任务专门化、智能分化的模型,类似动物大脑适应不同生态位[62] - 实现智能分化的技术挑战包括如何在微调时不损失已有能力,目前缺乏精细化“操作智能”的基础工具[66] 算力与协作模式的新形态 - 算力可能取代财富成为更关键的稀缺资源和衡量标准,个人算力设备既可自用也可贡献给自动化研究网络[76][77] - 可设计系统利用互联网上大规模的不可信算力节点池进行协作(如自动化研究),通过可信节点验证结果,形成“群体智能”[70][71][72] - 这种模式下,算力成为最核心的贡献形式,个人或公司可为自己关心的研究问题贡献算力[73] 对就业市场与工程需求的长期影响 - AI现阶段应被视为赋能工具,可大幅加速工作中的部分任务[83] - 软件工程领域可能呈现杰文斯悖论,即开发成本下降将释放被压抑的需求,导致软件需求总量增加[84] - 长期影响不确定,但构建AI的研究人员本身也在打造可能替代自己工作的自动化系统[86][87] 开源与闭源模型的竞争格局 - 闭源模型仍处领先,但开源模型与前沿的差距已从18个月缩短至约6到8个月[100] - 预期形成健康平衡格局:闭源模型探索前沿;开源模型稍落后,作为行业可信任的公共智能层,覆盖大量基础场景[105][106][107] - 过度集中化于少数闭源系统存在风险,希望有更多实验室参与前沿竞争[111][113] 数字世界与物理世界的演进路径 - AI引发的效率提升和重构将首先大规模发生在数字世界,然后转向数字与物理的接口层,最后才是全面的物理世界自动化[116][121] - 机器人等物理世界应用因复杂度高、投入大而滞后,但未来市场规模巨大[116][120] - 许多创新公司将出现在数字与物理的接口层,解决现实世界数据输入与决策输出问题[119][122]