长周期智能体
搜索文档
红杉合伙人:2026,AGI已经来了
机器之心· 2026-01-18 12:05
文章核心观点 - 红杉资本合伙人认为,通用人工智能(AGI)已经到来,其功能性定义是“能把事情搞清楚的能力”,而长周期智能体(如Claude Code)是这一能力的首批例证 [1][8][14] - 长周期智能体的能力正以指数级速度增长,大约每7个月翻一番,预计到2028年能完成人类专家一天的工作,到2034年能完成一年的工作 [4][24] - 人工智能应用正从“说话者”向“行动者”演进,2026年将是长周期智能体的元年,它们将像同事一样全天候工作,彻底改变工作模式 [10][27] AGI的功能性定义与现状 - AGI被定义为“能把事情搞清楚的能力”,其核心要素包括:基础知识(预训练)、基于知识的推理能力(推理时计算)以及迭代寻找答案的能力(长周期智能体)[14][16] - 2022年ChatGPT的出现标志着知识/预训练要素的突破,2024年底o1的发布带来了推理/推理时计算能力,而过去几周Claude Code等编程智能体则跨越了长周期智能体的能力门槛 [16] - 长周期智能体已能像人一样连续自主工作数小时,发现并修正自身错误,无需具体指令即可自行判断,这标志着AGI在功能上已经实现 [16] 长周期智能体的能力例证 - 一个具体案例是,智能体在31分钟内为一位创始人找到了合适的开发者关系负责人候选人,过程包括在LinkedIn、YouTube、Twitter上交叉验证信息,并最终起草精准的挖角邮件 [3][4][20] - 该智能体自主完成了形成假设、验证、碰壁、转向直至找到答案的全过程,展示了在模糊情境中导航以达成目标的“把事情搞清楚”的能力 [4][20] - 智能体目前仍会失败,例如产生幻觉或丢失上下文,但趋势明确且这些失败正变得越来越可修复 [20] 技术路径与发展曲线 - 实现长周期智能体主要依赖两种可扩展的技术路径:强化学习(由研究实验室推动)和智能体框架(由应用层产品设计)[22][23][24] - 市场已出现一些以其智能体框架闻名的产品,例如Manus、Claude Code、Factory的Droids等 [24] - 根据METR的追踪,长周期智能体完成长周期任务的能力正以指数级进步,大约每7个月翻一番 [24] - 按此指数曲线推算,到2028年智能体可可靠完成人类专家一天的任务,2034年完成一年的任务,2037年完成一个世纪的任务 [24] 行业影响与应用前景 - AI应用正从2023-2024年的“说话者”(对话式应用)向2026-2027年的“行动者”演进,后者将像同事一样被全天候使用,用户将从个人贡献者转变为智能体团队的管理者 [27] - 长周期智能体将解锁基于“工作成果”出售的新商业模式,促使企业重新思考如何将工作产品化、可靠交付以及根据价值和成果定价 [28] - 多个行业已出现具体应用案例:医疗(OpenEvidence扮演专科医生)、法律(Harvey扮演律师助理)、网络安全(XBOW扮演渗透测试员)、运维(Traversal扮演SRE)、销售(Day AI扮演业务开发等)、招聘(Juicebox扮演招聘官)、数学(Harmonic扮演数学家)、芯片设计(Ricursive扮演芯片设计师)、AI研究(GPT-5.2和Claude扮演研究员)[31] - 长周期智能体将能处理海量、长期的任务,例如分析20万项临床试验、挖掘所有客户支持工单信号或重构整部美国税法,使原本雄心勃勃的路线图变得可行 [29][30]
红杉资本合伙人放话:从会聊到会干,2026年AGI已经来了
36氪· 2026-01-16 18:51
文章核心观点 - 红杉资本合伙人断言,通用人工智能(AGI)在2026年已经以“长周期智能体”的形式到来,其标志是AI能够自主、持续地“把事情想明白”并解决现实问题,而非进行哲学辩论 [1] - AI的能力边界正从“聊天”扩展到“办事”,工作模式将从人类作为“执行者”转变为管理AI团队的“经理”,标志着生产力关系的重构 [3][11][12] AGI的务实定义 - 红杉资本提出了一个极度务实的AGI定义:“把事情想明白的能力”,这需要结合知识(预训练模型)、推理(更强计算模型)和迭代试错(长周期智能体)三种能力 [5] - 该定义不关心AI内部复杂性,只关注其能否真实解决问题和影响现实世界,能办到即为“通用” [5] AGI的应用落地实例 - 一个AI智能体在31分钟内,为一位创始人精准锁定了几乎完美匹配的招聘目标,完成了从模糊指令到具体人选和行动草案的全流程 [3][6][7] - 该智能体执行了类似资深猎头的复杂操作:在LinkedIn搜索、通过YouTube会议演讲评估实力、在Twitter分析真实性格与跳槽信号,并进行交叉验证排除 [6] - 整个过程展示了AI在模糊目标中自主探索、试错、转向并打通路径的能力,即“把事情想明白” [7] 技术核心突破:长周期智能体 - 当前AI能执行长时间任务的关键在于“长周期智能体”,它为AI提供了“持久专注”和“任务管理”能力 [9] - 主要通过两种方式实现:1) 使用强化学习训练模型以在长任务中保持专注;2) 通过智能体框架提供外部辅助工具来管理记忆和规划步骤 [9] - 独立评估机构METR数据显示,AI完成长周期任务的能力大约每7个月翻一番,呈现指数级进步 [9] 长周期智能体的发展预测 - 根据当前指数级进步速度推算:到2028年,AI能可靠完成人类专家一整天的工作;到2034年,能完成人类专家一年的工作;到2037年,能处理人类需要100年才能完成的任务 [10] - 100年工作量的例子包括分析所有历史临床实验数据、从海量客服记录中挖掘规律,或彻底重写庞杂税法 [10] 行业影响与工作模式变革 - AGI的试金石是能否“雇佣”它,专业化的“AI员工”正在涌现,例如AI专科医生、AI律师助理、AI网络安全员、AI芯片设计师和AI研究员 [11] - 2023-2024年的AI主要是“谈论者”(聊天对象),而2026-2027年的AI将成为“执行者”(真正的同事) [11] - 工作模式将被颠覆:从每天向AI提问几次,转变为每天有多个AI同时为人类工作 [11] - 人类的角色将从亲力亲为的“执行者”转变为管理AI团队的“经理”,使得“售卖工作”成为可能 [11][12] 结论与行动呼吁 - 长周期智能体的指数级增长已启动,当前能可靠运行30分钟,不久将能承包人类一天的工作,未来视野将以“世纪”为单位 [12] - 当AI不仅能回答“是什么”,更能持续探索“怎么办”时,意味着生产力关系的重构 [12] - 呼吁行业不再只将AI视为聊天机器人或搜索引擎,而是时候给AI“派活儿”了,这场静默的变革已经开始 [13]