软件工程与开发范式变革 - 个人编程工作流发生剧变,从2023年12月起,编程工作分配从80%自己写代码、20%委托给Agent,转变为20%自己写、80%委托给Agent,甚至更极端[5][6] - 软件工程默认工作流与几个月前已完全不同,工程师从写单行代码转变为向多个Agent分发互不冲突的大任务,并进行审核、整合和调度[6][9] - 软件行业正按“Agent First”重构,未来许多产品将不再提供给人直接点击的UI,而是暴露足够好的API,由Agent进行编排[20][21] - 软件的第一客户可能不再是人类,而是代表人类行动的Agent[22] Agent与“龙虾”的演进 - 出现了比普通Agent更持久的“龙虾”,它并非单次对话即结束,可在后台长期运行,拥有自己的沙盒、记忆和持续性,能处理需要人类持续关注的任务[11][12] - 成功的Agent需具备三个关键要素:良好的人格感(使其像队友)、有效的记忆系统、以及将所有自动化入口统一到单一通道(如WhatsApp)[13][14][15] - Agent的应用正从代码编写扩展到智能家居等领域,例如名为“Dobby”的管家“龙虾”可整合控制家庭局域网内的多个系统,并通过自然语言交互[17][18] - 未来许多软件可能不再以独立App的形式存在,而是被Agent通过调用底层API的方式折叠掉[19] 自动化研究(AutoResearch)与能力扩展 - AutoResearch的核心目标是将研究者从循环中移除,通过设定目标、指标和边界,让Agent自动进行实验、训练和优化,以提升系统的token吞吐量[25][26] - 在已由熟练研究者手动优化的小模型上,AutoResearch仍能找到被忽略的调参组合(如weight decay、Adam betas),带来性能提升,这预示了该范式在更大规模研究中的潜力[29][30] - 研究本身的可组织方式(如program.md文件)也成为优化对象,研究对象从模型扩展到研究流程和组织结构[32][33][34] - 可考虑构建“不可信外部工作池”与“可信验证池”协作的系统,利用大量分散的不可信算力进行搜索,由可信系统进行廉价验证,这种结构可能在某些任务上超越前沿实验室[52][53][55] AI能力现状与未来趋势 - AI能力进步存在“锯齿状”不均衡,在可验证、能打分、能被强化学习优化的任务上进步飞快,但在涉及细微意图、语气等任务上表现不稳定[39][43][45] - 应预期智能出现更多“物种分化”,未来可能出现保有通用认知核心、但在特定任务上高度专门化的模型,而非追求单一模型在所有任务上都顶尖[47][49] - 闭源模型目前仍领先,但开源模型正在快速收敛,差距从约18个月缩短至约6到8个月,开源模型已能很好覆盖大量消费级和基础应用场景[67][68][70] - 数字空间(处理比特)的变革将远快于物理世界(处理原子),主要处理数字信息的职业将首先被重写[58][74][75] 行业影响与未来机会 - 软件工程需求可能因杰文斯悖论而增长,即软件生产成本下降将释放更多需求,数字空间的大量重写和重新布线可能创造更多机会[61][62] - 未来可能出现服务于Agent的“信息市场”,Agent可为获取现实世界的新数据(如照片、实验结果)而出价,从而将经济活动从数字空间延伸至物理世界[77][78][79] - 机器人及物理空间自动化变革将滞后于数字空间,但市场潜力巨大,未来重要的公司可能出现在连接数字智能与物理世界的接口层[73][76] 1. 个人能力上限被极大抬高,瓶颈从个人打字编码速度转变为如何有效串联和调度Agent能力[4][7] - 随着工具成熟,个人能启动的项目范围大幅扩大,“一人独角兽公司”的出现成为必然预期[103][104][105] 教育模式转变 - 教育接口正在变化,教学者未来可能不再直接向所有人讲授同一课程,而是将课程路径和关键点编写成“skill”脚本,由Agent进行无限耐心和定制化的解释[90][92][98] - “skill”本质是“如何教Agent去教人”的脚本,教育者的角色将更侧重于补充Agent尚无法做到的部分[94][99]
Andrew Karpathy 最新对谈:未来软件的第一客户是 Agent,软件业还剩下多少“人的位置”?
AI科技大本营·2026-03-22 17:23