目标对齐(Alignment)

搜索文档
外滩大会:图灵奖得主理查德·萨顿提出AI正进入“经验时代”
环球网资讯· 2025-09-11 16:33
萨顿呼吁,应支持制度化的协作机制。AI与人类的繁荣,终究要靠"去中心化协作"来实现。"协作就是 我们的伟大超能力,人类最卓越的超能力就在于我们比其他任何动物都更擅长协作。"萨顿说道。 【环球网科技报道 记者 李文瑶】9月11日消息,在2025年外滩大会主论坛上,2024年图灵奖得主、"强 化学习之父"理查德·萨顿(Richard Sutton)在演讲中从科技、政治与哲学三个维度,系统阐述了对人工 智能当前与未来的核心判断,并提出人类正从"人类数据时代"迈向"经验时代"的重要转折。 科技趋势:从"人类数据时代"走向"经验时代" 他提出,我们正在进入"经验时代",AI应像AlphaGo或AlphaProof那样,通过自我博弈或与环境交互, 生成属于智能体本身的"经验"——即观察、行动与奖励三大信号。这种基于强化学习的范式,才是实现 持续学习和元学习的关键。 支持制度化的协作机制 萨顿同时谈到,从地缘竞争到公众对失业、偏见甚至人类灭绝的恐惧,多方力量正推动对AI的严格管 控与目标对齐(Alignment)。但他认为,这类恐惧常被夸大甚至被某些利益集团利用。 他提出,智能体社会应仿效人类经济与自然界的运作方式——通过 ...