Workflow
长时程智能体
icon
搜索文档
红杉资本:这就是AGI
36氪· 2026-01-20 16:20
文章核心观点 - 2026年将成为通用人工智能(AGI)的元年,其核心标志是“长时程智能体”的成熟,标志着AI从对话者演变为能自主解决复杂问题的执行者[1] - 商业范式将从“销售软件”转向“销售工作成果”,智能体将成为全天候工作的“数字员工”,彻底重塑生产力边界[1][2] - 智能体处理复杂任务的能力正以每7个月翻一番的速度指数级增长[2] 功能性定义:AGI即“自行解决问题”的能力 - 红杉资本提出了一个务实的功能性AGI定义:即“自行解决问题的能力”[3] - 具备此能力的AI包含三个核心要素:基线知识(预训练)、推理能力(推理时计算)以及迭代能力(长时程智能体)[3] - 迭代能力是2024年以来的最新突破,使AI能像人类一样在数小时内自主工作、修正错误并决定下一步行动[3] 从指令到自主:智能体的工作闭环 - 长时程智能体能在模糊环境中通过建立假设、测试、试错并调整方向来达成目标,这是其核心特征[5] - 以招聘场景为例,智能体能在31分钟内完成人类专家的心理循环,包括搜索竞对公司职位、筛选社交媒体活跃者、分析潜在离职信号并最终起草个性化联系邮件[4][5] 技术路径:强化学习与代理架构的双重驱动 - 实现长时程智能体的两种有效且可扩展的技术路径是强化学习与代理架构[6] - 强化学习主要由研究实验室主导,通过训练教导模型长时间保持专注,已在多智能体系统和工具使用可靠性方面取得显著进展[6] - 代理架构属于应用层,开发者通过设计特定脚手架来规避模型局限,市场好评产品如Manus、Claude Code和Factory's Droids均得益于此[6] - 根据METR的追踪,智能体能力呈指数级增长,预计到2028年将能可靠完成人类专家一整天的工作量,到2034年将能完成一整年的工作量[6] 商业变革:从软件到“数字员工” - 检验AGI的试金石是能否雇佣一个智能体,目前从医药、法律到网络安全等各行各业的专用智能体正在迅速涌现[7] - 对创业者而言,这意味着巨大的范式转移:2023-2024年的AI应用多为“对话者”,而2026年及以后的应用将是“执行者”,使得“销售工作”成为可能[7] - 创始人需要重新思考哪些持续关注的任务可被智能体接管,并针对“结果”而非“工具”进行定价和包装[7] - 虽然当前智能体可能只能可靠工作约30分钟,但其能力将快速增长,最终能处理相当于人类一世纪工作量的任务,使曾经宏大的路线图变得可行[7]
红杉资本:2026将是AGI元年,编程智能体已经打响了第一枪!
华尔街见闻· 2026-01-19 19:41
文章核心观点 - 通用人工智能(AGI)已从概念变为现实,其功能性定义是“自行解决问题的能力”,2026年将是AGI元年 [1] - 以编程智能体为代表的长时程智能体已落地,标志着AI从“对话者”向能够实际交付工作的“执行者”转型 [1] - AI智能体的能力正以指数级速度增长,将彻底改变企业的人才结构、生产力边界以及商业和投资范式 [1][2][7] 功能性定义与核心特征 - AGI的功能性定义被界定为“自行解决问题的能力”,对于企业而言,AI能否完成任务比其实现方式更重要 [3] - 长时程智能体具备在模糊环境中通过建立假设、测试、试错并调整方向直至达成目标的核心能力 [4] - 智能体能够自主执行复杂任务闭环,例如在招聘场景中,可在31分钟内完成人类专家的心理循环,包括跨平台搜索、分析潜在离职信号并起草联系邮件 [3] 技术路径与能力增长 - 实现AGI跨越的两种有效且可扩展的技术路径是:由研究实验室主导的强化学习,以及在应用层通过设计特定脚手架来规避模型局限的代理架构 [5][6] - 智能体处理复杂任务的能力正以每7个月翻一番的速度呈指数级增长 [2] - 根据趋势推算,智能体在2028年将能可靠地完成人类专家需耗时一整天的工作,到2034年将能完成一整年的工作量 [6] - 最新的突破是迭代能力,即AI能够像人类一样在数小时内自主工作、修正错误并自主决定下一步行动 [5] 商业影响与范式转移 - 商业逻辑将发生根本性变化,从销售软件转向直接“销售工作成果”,未来的AI应用将作为“数字员工”或“同事”全天候并行工作 [1][7] - 创业者面临巨大范式转移,2026年及以后的应用将是“执行者”,这使得针对“结果”而非“工具”进行定价和包装成为可能 [7] - 从医药领域的OpenEvidence、法律领域的Harvey到网络安全领域的XBOW,各行各业的专用智能体正在迅速涌现 [7] - 曾经宏大的路线图(如交叉比对20万个临床试验数据或重构整个美国税法代码)因智能体能力的提升而变得切实可行 [7]