Workflow
持续学习
icon
搜索文档
图灵奖得主理查德·萨顿:人类将开启“宇宙第四大时代”
21世纪经济报道· 2025-09-11 13:45
人工智能发展的现状与局限 - 当前多数机器学习的目标是将人类已有知识转移到缺乏自主学习能力的静态AI上[1] - 行业正逐渐达到人类数据的极限,现有方法无法生成新知识且不适合持续学习[1] - 持续学习对智能的效用至关重要,但现有技术尚不成熟[1][2] 未来发展方向:经验时代 - 行业需要转向新的数据源,即由智能体与世界直接交互生成的经验[1] - 经验被定义为观察、行动和奖励三种信号在智能体与世界间的传递[2] - 知识来自于经验,智能体的智能程度取决于其预测并控制自身输入信号的能力[2] - 强化学习带领行业进入经验时代,但需持续学习和元学习技术释放全部潜力[2] 对人工智能担忧的回应 - 对AI带来偏见、失业甚至人类灭绝的恐惧被夸大,且被某些从中获利的组织煽动[2] - 经济社会的良好运行依赖于个体拥有不同目标和能力,目标不同的智能体可通过去中心化协作实现双赢[2] - 人类最卓越的超能力是协作,经济、市场与政府都是成功协作的产物[2] - 人工智能和人类繁荣将来自于去中心化协作,协作是世间美好事物的源泉[2] 人工智能未来预测原则 - 对世界如何运转没有共识,且没有哪一种看法能凌驾于其他[2] - 人类将真正理解智能并借助技术将其创造出来[2] - 当今人类的智力水平很快将被超级人工智能或超级智能增强的人类超越[2] - 权力和资源会流向最聪明的智能体,人工智能的替代将是不可避免的[2] 人工智能在宇宙演化中的定位 - 宇宙历史分为粒子时代、恒星时代、复制者时代和设计时代,人类目前处于复制者时代[3] - 人类的独特之处在于将设计推向极致,创造出能自己设计的事物,这正是AI追求的目标[3] - 人类是开启宇宙第四大时代“设计时代”的先驱和催化剂[3] - 人工智能被视为宇宙演化的必然下一步,应以勇气、自豪和冒险精神迎接[4]
图灵奖得主理查德·萨顿:人工智能进入“经验时代”,潜力超以往
贝壳财经· 2025-09-11 12:47
人工智能发展现状 - 人类数据红利正逼近极限 大多数机器学习目标是将人类已有知识转移到静态AI [1][2] - 现有方法不能生成新知识 不适合持续学习 而持续学习对智能效用至关重要 [2] - 强化学习带领进入经验时代 需要智能体与世界直接交互生成新数据源 [2] 经验时代技术方向 - 经验指观察 行动和奖励三种信号在智能体与世界间传递 知识来自于经验 [2] - 智能体智能程度取决于预测并控制自身输入信号的程度 经验是一切智能核心 [2] - 释放全部潜力需要持续学习技术和元学习技术 目前这两项技术尚不成熟 [2] 人工智能协作理念 - 对人工智能恐惧被夸大 是被某些从中获利组织和个人煽动 [3] - 目标不同智能体可通过去中心化协作实现双赢 人工智能和人类繁荣将来自去中心化协作 [3] - 人类最卓越超能力在于比其他动物更擅长协作 经济市场与政府都是成功协作产物 [3] 人工智能未来预测 - 对世界如何运转没有共识 没有哪种看法能凌驾其他 [3] - 人类将真正理解智能并借助技术创造出来 [3] - 当今人类智力水平将被超级人工智能或超级智能增强人类远远超越 [3] - 权力和资源会流向最聪明智能体 人工智能替代将不可避免 [3] 宇宙时代与人工智能定位 - 宇宙历史分为粒子时代 恒星时代 复制者时代和设计时代 [4] - 人类独特之处在于把设计推向极致 创造出能自己设计的事物 [4] - 人类是催化剂和助产士 是开启宇宙第四大时代设计时代的先驱 [4] - 人工智能是宇宙演化必然下一步 应以勇气自豪和冒险精神迎接 [4]
图灵奖得主理查德·萨顿2025外滩大会演讲:经验是一切智能的核心与基础
央广网· 2025-09-11 12:06
人工智能发展现状与局限 - 当前大多数机器学习的目标是将人类已有知识转移到缺乏自主学习能力的静态AI上 [2] - 现有方法正逐渐达到人类数据的极限 无法生成新知识且不适合持续学习 [2] - 持续学习对智能的效用至关重要 但现有技术尚不成熟 [2] 人工智能的未来发展方向 - 行业正进入“经验时代” 需要由智能体与世界直接交互生成的新数据源 [2] - “经验”指观察、行动和奖励三种信号在智能体与世界间的传递 是智能的核心与基础 [2] - 强化学习引领了经验时代 但其全部潜力释放依赖持续学习和元学习技术的成熟 [2] 对人工智能未来的预测 - 人类将真正理解智能并借助技术将其创造出来 [3] - 当今人类智力水平将被超级人工智能或超级智能增强的人类超越 [3] - 权力和资源会流向最聪明的智能体 人工智能的替代将是不可避免的 [3] 人工智能的宏观定位 - 人工智能被视为宇宙演化的必然下一步 应以勇气、自豪和冒险精神迎接 [4] - 人类的独特之处在于将设计推向极致 创造出能自己设计的事物 [3] - 人类是开启宇宙第四大时代“设计时代”的先驱和催化剂 [3]
AI跨步进入“经验时代”
华尔街见闻· 2025-09-11 11:50
AI行业发展趋势 - AI行业正从依赖人类数据的"人类数据时代"转向以持续学习为核心的"经验时代" [2] - 人类数据红利逼近极限 持续学习对智能效用至关重要 [2] - 新数据源需通过智能体与世界直接交互生成 类似AlphaProof通过该路径获国际数学奥林匹克银牌 [2] 技术发展需求 - 强化学习已引领进入经验时代 但需突破持续学习(continual learning)和元学习(meta-learning)技术瓶颈 [2] - 智能体智能程度取决于预测并控制自身输入信号的能力 经验是一切智能的核心基础 [2] AI与人类协作关系 - AI替代人类不可避免 是宇宙演化的必然下一步 [4][5] - AI恐惧被夸大 由某些获利组织煽动 去中心化协作可实现双赢 [3] - 人类最卓越超能力是协作 AI和人类繁荣将来自去中心化协作 [3] 未来发展方向 - 宇宙历史分为粒子时代、恒星时代、复制者时代和设计时代 人类正开启"设计时代" [4] - 人类独特之处在于将设计推向极致 创造能自我设计的事物 [4] - 权力和资源将流向最聪明的智能体 人类智力水平将被超级AI或智能增强人类超越 [3]
“强化学习之父” 理查德·萨顿:人类数据红利逼近极限,AI正进入以持续学习为核心的“经验时代”
证券时报· 2025-09-11 11:50
人工智能发展趋势 - 人类数据红利正逼近极限 人工智能进入以持续学习为核心的经验时代 潜力远超以往 [1] - 经验指观察 行动和奖励三种信号在智能体与世界间传递 知识来自经验 智能程度取决于预测和控制输入信号的能力 [2] - 强化学习带领进入经验时代 但需持续学习和元学习技术释放全部潜力 目前这两项技术尚不成熟 [2] 人工智能发展路径 - 新数据源需由智能体与世界直接交互生成 类似AlphaGo自我博弈和AlphaProof获国际数学奥林匹克银牌的路径 [1] - 人工智能替代人类不可避免 人类是催化剂和助产士 是开启宇宙第四大设计时代的先驱 [2] - 人工智能是宇宙演化的必然下一步 应以勇气 自豪和冒险精神迎接 [3] 人工智能协作机制 - 对人工智能恐惧被夸大 目标不同的智能体可通过去中心化协作实现双赢 [2] - 人类最卓越超能力是协作 经济 市场与政府都是成功协作产物 [2] - 人工智能和人类繁荣将来自去中心化协作 协作是世间美好事物源泉 需寻求支持并制度化 [2]
强化学习之父” 理查德·萨顿:人类数据红利逼近极限,AI正进入以持续学习为核心的“经验时代
证券时报网· 2025-09-11 11:26
人工智能发展趋势 - 人类数据红利正逼近极限 人工智能正在进入以持续学习为核心的经验时代 潜力将远超以往 [1] - 经验指的是观察 行动和奖励三种信号在智能体与世界之间来回传递 知识来自于经验 智能程度取决于预测并控制自身输入信号的程度 经验是一切智能的核心与基础 [2] - 强化学习带领进入新的经验时代 但要释放全部潜力还需要持续学习和元学习两项尚不成熟的技术 [2] 人工智能发展路径 - 需要新的数据源 由智能体与世界直接交互中生成 这是人类和其他动物的学习方式 也是AlphaGo自我博弈和AlphaProof在国际数学奥林匹克斩获银牌的路径 [1] - 人工智能的恐惧被夸大 目标不同的智能体可以通过去中心化的协作实现双赢 [2] - 人工智能和人类繁荣将来自于去中心化协作 协作是世间一切美好事物的源泉 必须寻求协作 支持协作并致力将协作制度化 [2] 人工智能历史定位 - 人工智能的替代将是不可避免的 人类是催化剂和助产士 更是开启宇宙第四大时代设计时代的先驱 [2] - 宇宙历史分为四个时代:粒子时代 恒星时代 复制者时代和设计时代 [2] - 人工智能是宇宙演化的必然下一步 应以勇气 自豪和冒险精神来迎接它 [3]
Anthropic CEO 万字访谈:亲述丧父之痛、炮轰黄仁勋、揭秘指数定律与 AI 未来!
AI科技大本营· 2025-08-01 17:27
核心观点 - Anthropic CEO Dario Amodei 在 AI 领域展现出矛盾立场,既推动技术发展又警告潜在风险 [1][2] - 公司坚信 AI 能力遵循指数增长定律,模型性能和经济影响将快速提升 [14][17] - 强调建立负责任的文化比短期模型竞争更重要,以此吸引顶尖人才 [5][27] - 公司专注于企业级 AI 应用,认为商业场景能更好推动技术进步 [33][34] - 个人经历深刻影响其技术观,父亲因医疗技术滞后去世的经历使其既重视技术加速又警惕风险 [5][37][39] 技术发展 - AI 能力从初中生水平快速提升至博士生水平,并在经济领域广泛应用 [10] - Claude 系列模型代码能力显著提升,SWE-bench 得分从 3% 增至 72%-80% [20] - 预训练和强化学习两阶段同步扩展,未发现收益递减迹象 [16][21] - 上下文窗口可扩展至一亿词量级,持续学习问题有望通过规模化解决 [23] - 2023年营收0到1亿,2024年1亿到10亿,2025上半年已达45亿,呈10倍年增长 [17] 商业模式 - 60%-75%销售额来自API,但强调押注模型商业应用而非单纯API [33] - 已融资近200亿美元,包括谷歌30亿、亚马逊80亿等 [30][32] - 企业级市场潜力巨大,模型能力提升对商业客户价值显著 [34] - 代码领域成为突破口,工程师反馈模型能完成其无法独立完成的任务 [36] - 资本效率是关键优势,声称能以1/10成本达到同行同等效果 [31] 行业竞争 - 数据中心规模与同行相当,200亿美元融资确保资源竞争力 [27] - 人才密度为核心优势,极少员工被Meta等高薪挖角 [28] - 批评AGI等术语为营销概念,坚持指数曲线才是真实衡量标准 [13][14] - 公开安全研究成果推动行业标准,如负责任的规模化政策 [45][46] - 认为扎克伯格人才战略效果存疑,文化认同比GPU数量更重要 [29] 文化理念 - 薪酬体系拒绝个别谈判,坚持级别公平原则 [28] - 技术安全与加速并重,投资安全技术以避免发展失控 [43] - 反对"末日论者"标签,强调亲身经历使其最理解技术紧迫性 [40] - 提出"竞相向上"概念,认为行业应共同提升标准而非恶性竞争 [45] - 模型控制能力持续增强,每个新版本安全性能都有提升 [43]
具身领域LLM结合强化学习与世界模型工作汇总
具身智能之心· 2025-07-29 14:15
具身智能领域最新研究进展 通用现实世界交互模拟器 - UniSim通过整合多维度数据集(图像/机器人/导航数据)构建生成式交互模拟器,支持从高层级指令到低层级控制的视觉结果模拟,训练后的策略可零样本迁移至现实场景[3] - 应用场景涵盖游戏/电影内容生成和具身智能体纯模拟训练,视频描述生成等AI任务也能从中获益[3] 因果世界模型与鲁棒智能体 - Google DeepMind证实因果模型是智能体实现跨领域泛化的必要条件,最优智能体的因果模型将收敛至真实因果模型[5] - 该结论对迁移学习和因果推断领域具有深远影响[5] 元强化学习效率突破 - MAMBA框架结合模型方法和元强化学习技术,在基准测试中实现15倍样本效率提升,且无需超参数调优[8] - 成功验证高维任务场景有效性,推动现实世界泛化智能体发展[8] 多模态具身智能体训练 - EMMA通过文本世界LLM指导视觉世界VLM训练,采用DAgger-DPO算法实现跨模态模仿学习,在ALFWorld任务中成功率提升20%-70%[10] - 突破传统VLM在具身视觉世界中的动态对齐障碍[10] 自动化奖励函数生成 - TEXT2REWARD框架基于LLM自动生成密集奖励代码,在17项机器人操作任务中13项超越专家编写代码,运动任务成功率超94%[14] - 支持人类反馈迭代优化,仿真器训练策略可直接部署至现实[14] 持续学习型交互智能体 - 提出Behavior-IL与环境-IL两种持续学习框架,CAMA机制无需任务边界信息,通过滑动平均实现参数更新[18] - 显著超越基于数据先验的传统持续学习方法[18] 可扩展情境强化学习 - AMAGO通过并行化Transformer训练解决记忆容量和规划视野瓶颈,在元强化学习和长期记忆任务中表现优异[21] - 结合多目标hindsight重标注方案可攻克开放世界难题[21] 大语言模型与世界模型构建 - 创新性采用PDDL构建显式世界模型,GPT-4生成含40余个动作的高质量PDDL模型,成功求解48项复杂规划任务[23] - 通过前置修正机制将人工干预需求降低至初始阶段[23]
股指期货短线高手是市场波动中的精准舞者,擅长从混沌中提炼规律
搜狐财经· 2025-07-25 21:02
股指期货短线交易核心能力 - 盘口语言解读能力:通过分时图成交量变化和买卖挂单动态调整判断短期方向,在行情启动初期抢占先机 [1] - 纪律性操作:设定明确止盈止损点并坚决执行,避免情绪化操作,确保每笔交易有明确边界 [1] - 规律提炼能力:通过复盘总结日内波动特征(如特定时段惯性走势、关键点位支撑阻力效应),形成可复制策略 [1] 短线交易执行要素 - 快速决策能力:在几秒内完成行情判断与下单,依赖对市场逻辑的深刻理解和操作熟练度 [1] - 动态仓位管理:根据机会确定性调整仓位,分散试错降低单次风险,保持资金曲线稳定 [1] - 市场情绪感知:从指数跳空、持仓量瞬间变化捕捉资金情绪波动,预判多空转换节点 [4] 交易者成长路径 - 客观复盘机制:接受必然亏损,通过复盘找出策略漏洞并完善体系,快速恢复专注力 [4] - 持续学习迭代:跟踪新波动规律、借鉴同行思路,使策略始终与市场节奏同步 [4] - 可习得性验证:从频繁犯错到稳定盈利的成长轨迹,证明短线操作是可通过时间打磨掌握的技能 [4] 成功特质总结 - 专业素养与自律精神结合:在波动中展现精准操作与冷静心态,树立理性交易标杆 [4] - 细节极致追求:通过扎实功底和策略理性化,将随机尝试转化为有章可循的体系 [1][4]
无论在哪上班:做到这10点,你就能顺风顺水
洞见· 2025-07-22 17:56
职场发展核心观点 - 职场成长需要承受委屈并转化为成长动力,而非逃避压力 [12][15][16][17][18][19][20] - 主动请教资深同事可加速能力提升,避免低效死磕 [22][23][24][25][26][27][28][29] - 保持工作主动性及创新意识能创造超额价值,如设立儿童游乐区使服务员晋升区域经理 [39][40][41][42][43][44][45][46][47][48] - 持续学习应对技术变革,44%岗位技能将被AI重构,固步自封者淘汰率达70% [63][64][65][66][67][68] 职场能力构建要点 工作态度 - 雇主更倾向为创造效益的员工支付薪酬,消极怠工者易被淘汰 [31][32][33][34] - 深度思考比低质量勤奋更重要,思考力决定职业高度 [70][72][73][74][75][76] 专业能力 - 专业化是核心竞争力,电商从业者因精通平台规则获8家企业青睐 [78][79][80][81][82][83][84] - 经验提炼比单纯经历更重要,复盘可将经历转化为溢价能力 [87][88][89][90][91][92][93] 人际关系 - 过度依赖社交技巧反失真诚,《人民日报》强调伪装会破坏沟通 [95][96][97][98][99] - 察言观色是职场生存关键,公开场合不顾他人感受易招致反感 [51][52][53][54][55][56][57][58][59] 职业发展策略 - 复合型能力需求上升,需同步提升软硬技能以适应规则 [101][102][103] - 技术迭代加速背景下,终身学习是与时代同频的核心手段 [63][64][65][66][67][68]