文章核心观点 - 红杉资本合伙人认为,通用人工智能(AGI)已经到来,其功能性定义是“能把事情搞清楚的能力”,而长周期智能体(如Claude Code)是这一能力的首批例证 [1][8][14] - 长周期智能体的能力正以指数级速度增长,大约每7个月翻一番,预计到2028年能完成人类专家一天的工作,到2034年能完成一年的工作 [4][24] - 人工智能应用正从“说话者”向“行动者”演进,2026年将是长周期智能体的元年,它们将像同事一样全天候工作,彻底改变工作模式 [10][27] AGI的功能性定义与现状 - AGI被定义为“能把事情搞清楚的能力”,其核心要素包括:基础知识(预训练)、基于知识的推理能力(推理时计算)以及迭代寻找答案的能力(长周期智能体)[14][16] - 2022年ChatGPT的出现标志着知识/预训练要素的突破,2024年底o1的发布带来了推理/推理时计算能力,而过去几周Claude Code等编程智能体则跨越了长周期智能体的能力门槛 [16] - 长周期智能体已能像人一样连续自主工作数小时,发现并修正自身错误,无需具体指令即可自行判断,这标志着AGI在功能上已经实现 [16] 长周期智能体的能力例证 - 一个具体案例是,智能体在31分钟内为一位创始人找到了合适的开发者关系负责人候选人,过程包括在LinkedIn、YouTube、Twitter上交叉验证信息,并最终起草精准的挖角邮件 [3][4][20] - 该智能体自主完成了形成假设、验证、碰壁、转向直至找到答案的全过程,展示了在模糊情境中导航以达成目标的“把事情搞清楚”的能力 [4][20] - 智能体目前仍会失败,例如产生幻觉或丢失上下文,但趋势明确且这些失败正变得越来越可修复 [20] 技术路径与发展曲线 - 实现长周期智能体主要依赖两种可扩展的技术路径:强化学习(由研究实验室推动)和智能体框架(由应用层产品设计)[22][23][24] - 市场已出现一些以其智能体框架闻名的产品,例如Manus、Claude Code、Factory的Droids等 [24] - 根据METR的追踪,长周期智能体完成长周期任务的能力正以指数级进步,大约每7个月翻一番 [24] - 按此指数曲线推算,到2028年智能体可可靠完成人类专家一天的任务,2034年完成一年的任务,2037年完成一个世纪的任务 [24] 行业影响与应用前景 - AI应用正从2023-2024年的“说话者”(对话式应用)向2026-2027年的“行动者”演进,后者将像同事一样被全天候使用,用户将从个人贡献者转变为智能体团队的管理者 [27] - 长周期智能体将解锁基于“工作成果”出售的新商业模式,促使企业重新思考如何将工作产品化、可靠交付以及根据价值和成果定价 [28] - 多个行业已出现具体应用案例:医疗(OpenEvidence扮演专科医生)、法律(Harvey扮演律师助理)、网络安全(XBOW扮演渗透测试员)、运维(Traversal扮演SRE)、销售(Day AI扮演业务开发等)、招聘(Juicebox扮演招聘官)、数学(Harmonic扮演数学家)、芯片设计(Ricursive扮演芯片设计师)、AI研究(GPT-5.2和Claude扮演研究员)[31] - 长周期智能体将能处理海量、长期的任务,例如分析20万项临床试验、挖掘所有客户支持工单信号或重构整部美国税法,使原本雄心勃勃的路线图变得可行 [29][30]
红杉合伙人:2026,AGI已经来了
机器之心·2026-01-18 12:05