Workflow
设计时代
icon
搜索文档
演讲 | 强化学习之父 Sutton 隔空回应 Hinton:目前的 AI “理解不足,调参有余”
AI科技大本营· 2026-02-13 16:15
对当前AI进展的批判性思考 - 当前AI领域普遍共识是AI正以惊人速度进步,但需要对此提出质疑[6] - 大语言模型在语言运用和生成逼真图像视频方面是巨大突破,但这并非心智的本质功能,而是极度消耗算力的任务[7] - 许多新应用本质是超大规模计算和模式识别的具体功能,不代表智能的全部,有时仅为计算而被冠以“智能”之名[7] - 当前AI领域是“理解不足,调参有余”,并未真正掌握心智原理与智能法则,作为一门科学令人失望[8] - 当前主流AI模型本质是“脆弱的心智”,它们因掌握人类所有知识而显强大,但不可靠、无法专注、思维游离,在智能本质上并不强大[8] 定义“智能” - 威廉·詹姆斯定义心智特征为“通过多变的手段达到一致的目的”[11] - 艾伦·图灵的观点被解读为智能是“表现得像个人”,即通过图灵测试模仿人类行为[11] - 字典定义智能为“获取并应用知识与技能的能力”,强调了学习和获取的重要性[12] - 约翰·麦卡锡定义智能为“实现目标的能力中,涉及计算的那一部分”,强调能力、计算和实现目标[13] - 演讲者提出定义:“通过调整行为来实现目标的能力”,强调学习(调整)是智能的关键[13] - 当前AI主流观点集中在计算、模式识别和模仿人类上[14] 统一的心智科学与强化学习 - 应建立一门新的“统一心智科学”,同等适用于人类、动物和机器心智[15][16] - 强化学习可能是这门统一心智科学的开端,因为它横跨相关领域[18] - 强化学习是一种面向智能体的学习方式,通过与环境交互、从经验中学习来实现目标[20] - 强化学习比其他机器学习方法更现实、更宏大、更自主[21] - 强化学习核心是试错和延迟反馈,通过奖励信号让机器自行判断对错,接近自然界学习方式[22] - 强化学习可能是既非纯自然科学也非纯工程技术的“心智科学”雏形[23] 数据的时代 vs. 经验的时代 - 艾伦·图灵在1947年指出:“我们想要的是一台能从经验中学习的机器”[24] - 当前处于“人类数据时代”,AI通过训练预测人类的下一个词或图片标签,并通过人类专家微调[25] - 现代机器学习本质是将人类已有知识转移给机器,转移完成后机器变为静态,不再学习[26] - 人类数据时代正触及天花板,因为高质量人类数据资源(整个互联网的文本、图片和视频)已被挖掘殆尽[26] - 根本局限在于该方法无法创造新知识,仅总结互联网已有言论无法做出真正突破[26] - 需要进入“经验时代”,数据源需能随智能体能力提升而增长进化,这意味着任何静态数据集都不够[27] - 唯有从经验中——从与世界的交互中——才能获得动态数据,这是人类和动物的学习方式[27][28] 婴儿与网格世界:体验式AI原则 - “经验”指智能体与环境之间交换的数据流,而非模糊的意识流[31] - 婴儿通过不断接触新玩具、探索新事物来改变经验流并学习[31] - 生命的数据由活动生成,数据的难度自动匹配当前的理解力和技能水平[32] - 网格世界演示显示,智能体能在目标移动或出现障碍时,通过探索适应变化,学会新路径以实现目标[35] - 体验式AI的基础是智能体与世界交换信号(经验),这些信号是所有智能的基石[36] - 体验式AI的核心信号包括:观察(传感器数据)、动作(运动指令)、奖励(代表结果好坏的标量信号)[38] - 在体验式AI中,真理定义为“在这些信号中实际发生了什么”,目标定义为“让奖励信号最大化”[39] - 智能体现在于其能在多大程度上预测并控制它的经验[40] - 没有经验(如被冻结的大语言模型),智能就失去了依附对象[41] - 只有在经验中,才有明确的目标和真理[42] 现实主义的AI预测与发展阶段 - 尽管当前AI炒作引发恐惧,但其实并不强大,它们脆弱且不可靠,但这不妨碍其非常有用并创造巨大经济价值[43] - 真正的“重头戏”是创造超级智能AI以及被AI增强的超级人类,这将带来深刻变革[44] - 近十年AI发展可划分为三个阶段:模拟时代(如AlphaGo)、人类数据时代(大语言模型)、经验时代(正在进入)[50] - 经验时代将通向超人级能力,不仅仅是模仿人类,而是超越人类局限[50] AI的政治哲学:管控与合作 - 当前很多人呼吁管控AI,限制其目标、研究、算力,成立“安全研究所”,其真实意思是“控制”[45] - 呼吁对AI进行集中管控,与呼吁对人进行集中管控,其逻辑惊人地相似,都基于恐惧[46] - 应抵制基于恐惧的集中管控呼吁,未来繁荣应源于去中心化的合作,而非集中式控制[46] - 合作是世界上所有美好事物(经济、政府、社会)的源泉[46] 宇宙的四个伟大时代与人类的角色 - 从宇宙视角看,存在四个伟大时代:粒子时代、恒星时代、复制者时代、设计时代[52] - 复制者时代(如生物)的特征是事物被复制出来,无需理解原理[52][57] - 设计时代的特征是事物先存在于设计者心智中,再被创造到物理世界,如礼堂、椅子、衣服[52][57] - 设计之物比复制之物更容易改进和变异[52] - 人类是“特殊的复制者”,是将“设计”能力推向极致的复制者[52][53] - 极致的表现是设计出能够自我设计的东西,这正是AI领域所做的事[53] - 人类正在开启并实现宇宙的第四个伟大时代——设计时代,这是具有宇宙级意义的角色[54] 演讲核心总结 - 科学上:当前AI处于“人类数据时代”,虽强大但受限;正在进入更强大的“经验时代”,能持续学习新知[58] - 政治上:AI的政治就是人类的政治,应追求去中心化的合作,而非集中式控制[58] - 哲学上:AI是宇宙发展的必然下一阶段,应怀着勇气、自豪和冒险精神去拥抱它[58]
图灵奖得主萨顿:人们对人工智能的恐惧被夸大了
第一财经· 2025-09-11 12:06
AI发展范式转变 - 人工智能发展正从依赖静态人类数据的“人类数据时代”转向以第一人称视角互动生成数据的“经验时代”[1] - “经验”由观察、行动和奖励三种具体信号构成,智能体通过控制这些信号特别是奖励信号来提升智能水平[1] - 传统静态数据库已不足以支撑AI发展,需要能够伴随智能体能力提升而持续增长的新型数据源[1] AI发展的社会影响 - 人工智能已成为高度政治化议题,公众担忧其带来偏见、失业甚至人类灭绝风险[2] - 部分国家正立法限制AI模型能力,并有呼声要求暂停AI研究,将其与核武器等量齐观[2] - 对AI的恐惧被夸大,这本质上是人类“我们对他们”的思维模式导致的妖魔化[3] AI治理与发展原则 - 倡导采取去中心化的合作模式,每个智能体追求自身目标,类似经济体系运行方式[3] - 人类需要在AI政治议题中寻求协作、支持协作并将协作制度化[3] - 提出四条原则预测AI未来:全球无共识、将真正理解并创造智能、人类智能被超越、资源流向最聪明智能体[3] 人类在AI时代的角色 - 随着AI发展,人类需要找到新角色,作为复制者将设计提升到前所未有的高度[4] - 人类是催化剂和助产士,是开启宇宙“设计时代”的先驱[4] - 人工智能是宇宙演化的必然下一步,人类应以勇气、自豪和冒险精神迎接[5]
AI跨步进入“经验时代”
华尔街见闻· 2025-09-11 11:50
AI行业发展趋势 - AI行业正从依赖人类数据的"人类数据时代"转向以持续学习为核心的"经验时代" [2] - 人类数据红利逼近极限 持续学习对智能效用至关重要 [2] - 新数据源需通过智能体与世界直接交互生成 类似AlphaProof通过该路径获国际数学奥林匹克银牌 [2] 技术发展需求 - 强化学习已引领进入经验时代 但需突破持续学习(continual learning)和元学习(meta-learning)技术瓶颈 [2] - 智能体智能程度取决于预测并控制自身输入信号的能力 经验是一切智能的核心基础 [2] AI与人类协作关系 - AI替代人类不可避免 是宇宙演化的必然下一步 [4][5] - AI恐惧被夸大 由某些获利组织煽动 去中心化协作可实现双赢 [3] - 人类最卓越超能力是协作 AI和人类繁荣将来自去中心化协作 [3] 未来发展方向 - 宇宙历史分为粒子时代、恒星时代、复制者时代和设计时代 人类正开启"设计时代" [4] - 人类独特之处在于将设计推向极致 创造能自我设计的事物 [4] - 权力和资源将流向最聪明的智能体 人类智力水平将被超级AI或智能增强人类超越 [3]
强化学习之父:LLM主导只是暂时,扩展计算才是正解
量子位· 2025-06-10 10:23
大模型技术前景 - 当前大语言模型(LLM)主导地位是暂时的 未来5-10年将不再是技术前沿[1][4] - LLM依赖人类数据训练 但模仿人类思维只能达到人类水平上限 难以突破现有认知边界[9][10][11] - 静态数据集存在局限性 AI需要从第一人称交互中获取动态"体验数据"实现自我迭代[13][14][15] 强化学习与体验时代 - 强化学习之父Richard Sutton提出AI将进入"体验时代" 通过Agent与环境互动产生更高级数据[14][18] - AlphaGo第37手非常规走法证明体验学习能突破人类认知局限[14] - 持续学习算法+大规模算力扩展是强化学习发挥潜力的关键[20][22][23] Agent去中心化发展 - 不同目标Agent可通过去中心化合作实现互利共赢 类似人类社会经济运转模式[24] - 集中控制AI的主张源于恐惧 多样性目标与合作秩序更能释放AI潜力[25][26] - 未来AI将具备自主设计能力 人类角色转变为设计催化剂[29] 行业技术争议 - 技术社区对LLM发展存在分歧 部分观点认为LLM已接近领域天花板[31] - 技术突破常来自未知领域 当前LLM技术成熟度可能限制创新空间[31]