Andrew Karpathy 最新对谈：未来软件的第一客户是 Agent，软件业还剩下多少“人的位置”？

软件工程与开发范式变革 - 个人编程工作流发生剧变，从2023年12月起，编程工作分配从80%自己写代码、20%委托给Agent，转变为20%自己写、80%委托给Agent，甚至更极端[5][6] - 软件工程默认工作流与几个月前已完全不同，工程师从写单行代码转变为向多个Agent分发互不冲突的大任务，并进行审核、整合和调度[6][9] - 软件行业正按“Agent First”重构，未来许多产品将不再提供给人直接点击的UI，而是暴露足够好的API，由Agent进行编排[20][21] - 软件的第一客户可能不再是人类，而是代表人类行动的Agent[22] Agent与“龙虾”的演进 - 出现了比普通Agent更持久的“龙虾”，它并非单次对话即结束，可在后台长期运行，拥有自己的沙盒、记忆和持续性，能处理需要人类持续关注的任务[11][12] - 成功的Agent需具备三个关键要素：良好的人格感（使其像队友）、有效的记忆系统、以及将所有自动化入口统一到单一通道（如WhatsApp）[13][14][15] - Agent的应用正从代码编写扩展到智能家居等领域，例如名为“Dobby”的管家“龙虾”可整合控制家庭局域网内的多个系统，并通过自然语言交互[17][18] - 未来许多软件可能不再以独立App的形式存在，而是被Agent通过调用底层API的方式折叠掉[19] 自动化研究（AutoResearch）与能力扩展 - AutoResearch的核心目标是将研究者从循环中移除，通过设定目标、指标和边界，让Agent自动进行实验、训练和优化，以提升系统的token吞吐量[25][26] - 在已由熟练研究者手动优化的小模型上，AutoResearch仍能找到被忽略的调参组合（如weight decay、Adam betas），带来性能提升，这预示了该范式在更大规模研究中的潜力[29][30] - 研究本身的可组织方式（如program.md文件）也成为优化对象，研究对象从模型扩展到研究流程和组织结构[32][33][34] - 可考虑构建“不可信外部工作池”与“可信验证池”协作的系统，利用大量分散的不可信算力进行搜索，由可信系统进行廉价验证，这种结构可能在某些任务上超越前沿实验室[52][53][55] AI能力现状与未来趋势 - AI能力进步存在“锯齿状”不均衡，在可验证、能打分、能被强化学习优化的任务上进步飞快，但在涉及细微意图、语气等任务上表现不稳定[39][43][45] - 应预期智能出现更多“物种分化”，未来可能出现保有通用认知核心、但在特定任务上高度专门化的模型，而非追求单一模型在所有任务上都顶尖[47][49] - 闭源模型目前仍领先，但开源模型正在快速收敛，差距从约18个月缩短至约6到8个月，开源模型已能很好覆盖大量消费级和基础应用场景[67][68][70] - 数字空间（处理比特）的变革将远快于物理世界（处理原子），主要处理数字信息的职业将首先被重写[58][74][75] 行业影响与未来机会 - 软件工程需求可能因杰文斯悖论而增长，即软件生产成本下降将释放更多需求，数字空间的大量重写和重新布线可能创造更多机会[61][62] - 未来可能出现服务于Agent的“信息市场”，Agent可为获取现实世界的新数据（如照片、实验结果）而出价，从而将经济活动从数字空间延伸至物理世界[77][78][79] - 机器人及物理空间自动化变革将滞后于数字空间，但市场潜力巨大，未来重要的公司可能出现在连接数字智能与物理世界的接口层[73][76] 1. 个人能力上限被极大抬高，瓶颈从个人打字编码速度转变为如何有效串联和调度Agent能力[4][7] - 随着工具成熟，个人能启动的项目范围大幅扩大，“一人独角兽公司”的出现成为必然预期[103][104][105] 教育模式转变 - 教育接口正在变化，教学者未来可能不再直接向所有人讲授同一课程，而是将课程路径和关键点编写成“skill”脚本，由Agent进行无限耐心和定制化的解释[90][92][98] - “skill”本质是“如何教Agent去教人”的脚本，教育者的角色将更侧重于补充Agent尚无法做到的部分[94][99]