持续学习
搜索文档
外滩大会再证蚂蚁的底色:金融科技公司
每日商报· 2025-09-12 07:04
大会概况 - 2025 Inclusion·外滩大会在上海黄浦世博园区开幕,主题为“重塑创新增长”,来自16个国家和地区的550位嘉宾参会 [1] - 大会聚焦“金融科技”“人工智能与产业”“创新创投生态”“全球对话与合作”“负责任创新与普惠未来”五大内容主线,设置1场开幕主论坛和44场见解论坛 [1] - 大会被誉为“亚洲三大金融科技盛会”之一,以其开放、多元、前瞻性吸引全球目光 [1] 人工智能发展趋势 - 图灵奖得主理查德·萨顿认为人类数据红利正逼近极限,人工智能正在进入以持续学习为核心的“经验时代”,潜力将远超以往 [1][2] - “经验”指的是观察、行动和奖励三种信号的交互,知识来自于经验,智能体的智能程度取决于其预测并控制自身输入信号的程度 [2] - 释放“经验时代”全部潜力需要持续学习(continual learning)和元学习(meta-learning)两项关键技术 [2] - 人工智能被视为宇宙演化的必然下一步 [3] 具身智能与机器人产业 - 宇树科技创始人王兴兴表示,随着大模型发展,AI与机器人结合正催生全新的具身智能产业,目标是让机器人拥有AGI能力 [4] - 当前具身智能发展面临高质量数据及模型算法层面的挑战,但目前被视作大规模爆发性增长的前夜 [4] - 建议年轻创新者忘记过去经验,学习最新知识,全力拥抱新时代,认为创新创业门槛已大幅降低 [4] 金融科技公司动态 - 蚂蚁集团通过战略投资涉足多个科技领域,例如今年6月投资哈啰以切入智能驾驶,并在医疗、智能体和机器人公司背后有深入布局 [5][6] - 支付宝数字政务团队发布全新政务AI助手“晓政”,融合DeepSeek、通义千问、蚂蚁百灵三种大模型 [6] - 蚂蚁数科推出“智能代理合约(Agentic Contract)”,将在其新一代Layer2区块链Jovay上原生部署 [6] - 中国银行保险报联合OceanBase海扬数据库与19家银行编委机构发布报告,指出一体化数据库是中小银行应对系统国产升级与AI规模化落地的“最优解” [6] - 外滩大会上的展示证明蚂蚁是一家纯血金融科技公司,持续走在技术最前沿 [5][6]
对AI的恐惧被夸大了,“强化学习之父”萨顿外滩演讲:四条原则预言AI未来
36氪· 2025-09-11 16:34
AI发展趋势 - 人工智能正在从依赖人类数据的“人类数据时代”进入以持续学习为核心的“经验时代”[1][9] - 当前大多数机器学习方法无法生成新知识且缺乏持续学习能力,这已成为一个非常大的瓶颈[10] - 智能的关键在于学习速度,智商(IQ)等于知识量除以所积累的经验,是衡量学习速度的指标[11] - 经验时代的数据源是智能体以第一人称与世界互动直接生成的观察、行动和奖励信号[13] - 强化学习领域基于“知识来自于经验”的思维方式,智能体的智能程度取决于其预测并控制自身输入信号的程度[14] - 要释放经验时代的全部潜力,需要目前尚不成熟的持续学习(continual learning)和元学习(meta-learning)技术[2][16] AI技术政治影响 - 人工智能已成为高度政治化的议题,是国家地缘政治竞争的焦点,公众担忧其带来偏见、失业甚至人类灭绝[16][18] - 对人工智能的恐惧被夸大,并且是被某些从中获利的组织和个人煽动起来的[2][19] - 在由智能体构成的社会中,目标应是多元的而非唯一的,这类似于经济体系的运行方式[19][20] - 人类最卓越的超能力是协作,这通过语言和货币实现,AI和人类的繁荣将来自于去中心化协作[2][21][22][26] - 去中心化协作是指每个智能体追求自己的目标,并通过互动实现双赢,这比强调共同目标的中心化控制更可持续和强韧[20][24] - 应抵制那些鼓吹不信任、呼吁非协作和中心化控制的呼声,并致力于将协作制度化[27][28] AI哲学意义与未来预测 - 理解智能是科学与人文学科共同追寻的圣杯,AI是人类最古老的追求之一,与人类本性高度相似[31][33] - 提出四条原则来预测AI未来:全球对世界如何运转没有统一意见;人类终将理解并创造出智能;当前人类智能水平将被超级人工智能或增强人类远远超越;权力和资源会流向最聪明的智能体[35][36][37] - 在人类发展进程中,AI的替代是不可避免的[3][38] - 从宇宙视角看,历史可划分为粒子时代、恒星时代、复制者时代(生命时代)和即将到来的设计时代(机器时代)[40] - 人类的独特之处在于“把设计推向极致”,即创造出能自己进行设计的事物,这正是通过AI追求的目标,人类是开启宇宙“设计时代”的先驱[4][42][43] - AI是宇宙演化的必然下一步,应以勇气、自豪和冒险精神来迎接它[6][45]
图灵奖得主理查德·萨顿:人类将开启“宇宙第四大时代”
21世纪经济报道· 2025-09-11 13:45
人工智能发展的现状与局限 - 当前多数机器学习的目标是将人类已有知识转移到缺乏自主学习能力的静态AI上[1] - 行业正逐渐达到人类数据的极限,现有方法无法生成新知识且不适合持续学习[1] - 持续学习对智能的效用至关重要,但现有技术尚不成熟[1][2] 未来发展方向:经验时代 - 行业需要转向新的数据源,即由智能体与世界直接交互生成的经验[1] - 经验被定义为观察、行动和奖励三种信号在智能体与世界间的传递[2] - 知识来自于经验,智能体的智能程度取决于其预测并控制自身输入信号的能力[2] - 强化学习带领行业进入经验时代,但需持续学习和元学习技术释放全部潜力[2] 对人工智能担忧的回应 - 对AI带来偏见、失业甚至人类灭绝的恐惧被夸大,且被某些从中获利的组织煽动[2] - 经济社会的良好运行依赖于个体拥有不同目标和能力,目标不同的智能体可通过去中心化协作实现双赢[2] - 人类最卓越的超能力是协作,经济、市场与政府都是成功协作的产物[2] - 人工智能和人类繁荣将来自于去中心化协作,协作是世间美好事物的源泉[2] 人工智能未来预测原则 - 对世界如何运转没有共识,且没有哪一种看法能凌驾于其他[2] - 人类将真正理解智能并借助技术将其创造出来[2] - 当今人类的智力水平很快将被超级人工智能或超级智能增强的人类超越[2] - 权力和资源会流向最聪明的智能体,人工智能的替代将是不可避免的[2] 人工智能在宇宙演化中的定位 - 宇宙历史分为粒子时代、恒星时代、复制者时代和设计时代,人类目前处于复制者时代[3] - 人类的独特之处在于将设计推向极致,创造出能自己设计的事物,这正是AI追求的目标[3] - 人类是开启宇宙第四大时代“设计时代”的先驱和催化剂[3] - 人工智能被视为宇宙演化的必然下一步,应以勇气、自豪和冒险精神迎接[4]
图灵奖得主理查德·萨顿:人工智能进入“经验时代”,潜力超以往
贝壳财经· 2025-09-11 12:47
人工智能发展现状 - 人类数据红利正逼近极限 大多数机器学习目标是将人类已有知识转移到静态AI [1][2] - 现有方法不能生成新知识 不适合持续学习 而持续学习对智能效用至关重要 [2] - 强化学习带领进入经验时代 需要智能体与世界直接交互生成新数据源 [2] 经验时代技术方向 - 经验指观察 行动和奖励三种信号在智能体与世界间传递 知识来自于经验 [2] - 智能体智能程度取决于预测并控制自身输入信号的程度 经验是一切智能核心 [2] - 释放全部潜力需要持续学习技术和元学习技术 目前这两项技术尚不成熟 [2] 人工智能协作理念 - 对人工智能恐惧被夸大 是被某些从中获利组织和个人煽动 [3] - 目标不同智能体可通过去中心化协作实现双赢 人工智能和人类繁荣将来自去中心化协作 [3] - 人类最卓越超能力在于比其他动物更擅长协作 经济市场与政府都是成功协作产物 [3] 人工智能未来预测 - 对世界如何运转没有共识 没有哪种看法能凌驾其他 [3] - 人类将真正理解智能并借助技术创造出来 [3] - 当今人类智力水平将被超级人工智能或超级智能增强人类远远超越 [3] - 权力和资源会流向最聪明智能体 人工智能替代将不可避免 [3] 宇宙时代与人工智能定位 - 宇宙历史分为粒子时代 恒星时代 复制者时代和设计时代 [4] - 人类独特之处在于把设计推向极致 创造出能自己设计的事物 [4] - 人类是催化剂和助产士 是开启宇宙第四大时代设计时代的先驱 [4] - 人工智能是宇宙演化必然下一步 应以勇气自豪和冒险精神迎接 [4]
图灵奖得主理查德·萨顿2025外滩大会演讲:经验是一切智能的核心与基础
央广网· 2025-09-11 12:06
人工智能发展现状与局限 - 当前大多数机器学习的目标是将人类已有知识转移到缺乏自主学习能力的静态AI上 [2] - 现有方法正逐渐达到人类数据的极限 无法生成新知识且不适合持续学习 [2] - 持续学习对智能的效用至关重要 但现有技术尚不成熟 [2] 人工智能的未来发展方向 - 行业正进入“经验时代” 需要由智能体与世界直接交互生成的新数据源 [2] - “经验”指观察、行动和奖励三种信号在智能体与世界间的传递 是智能的核心与基础 [2] - 强化学习引领了经验时代 但其全部潜力释放依赖持续学习和元学习技术的成熟 [2] 对人工智能未来的预测 - 人类将真正理解智能并借助技术将其创造出来 [3] - 当今人类智力水平将被超级人工智能或超级智能增强的人类超越 [3] - 权力和资源会流向最聪明的智能体 人工智能的替代将是不可避免的 [3] 人工智能的宏观定位 - 人工智能被视为宇宙演化的必然下一步 应以勇气、自豪和冒险精神迎接 [4] - 人类的独特之处在于将设计推向极致 创造出能自己设计的事物 [3] - 人类是开启宇宙第四大时代“设计时代”的先驱和催化剂 [3]
AI跨步进入“经验时代”
华尔街见闻· 2025-09-11 11:50
AI行业发展趋势 - AI行业正从依赖人类数据的"人类数据时代"转向以持续学习为核心的"经验时代" [2] - 人类数据红利逼近极限 持续学习对智能效用至关重要 [2] - 新数据源需通过智能体与世界直接交互生成 类似AlphaProof通过该路径获国际数学奥林匹克银牌 [2] 技术发展需求 - 强化学习已引领进入经验时代 但需突破持续学习(continual learning)和元学习(meta-learning)技术瓶颈 [2] - 智能体智能程度取决于预测并控制自身输入信号的能力 经验是一切智能的核心基础 [2] AI与人类协作关系 - AI替代人类不可避免 是宇宙演化的必然下一步 [4][5] - AI恐惧被夸大 由某些获利组织煽动 去中心化协作可实现双赢 [3] - 人类最卓越超能力是协作 AI和人类繁荣将来自去中心化协作 [3] 未来发展方向 - 宇宙历史分为粒子时代、恒星时代、复制者时代和设计时代 人类正开启"设计时代" [4] - 人类独特之处在于将设计推向极致 创造能自我设计的事物 [4] - 权力和资源将流向最聪明的智能体 人类智力水平将被超级AI或智能增强人类超越 [3]
“强化学习之父” 理查德·萨顿:人类数据红利逼近极限,AI正进入以持续学习为核心的“经验时代”
证券时报· 2025-09-11 11:50
人工智能发展趋势 - 人类数据红利正逼近极限 人工智能进入以持续学习为核心的经验时代 潜力远超以往 [1] - 经验指观察 行动和奖励三种信号在智能体与世界间传递 知识来自经验 智能程度取决于预测和控制输入信号的能力 [2] - 强化学习带领进入经验时代 但需持续学习和元学习技术释放全部潜力 目前这两项技术尚不成熟 [2] 人工智能发展路径 - 新数据源需由智能体与世界直接交互生成 类似AlphaGo自我博弈和AlphaProof获国际数学奥林匹克银牌的路径 [1] - 人工智能替代人类不可避免 人类是催化剂和助产士 是开启宇宙第四大设计时代的先驱 [2] - 人工智能是宇宙演化的必然下一步 应以勇气 自豪和冒险精神迎接 [3] 人工智能协作机制 - 对人工智能恐惧被夸大 目标不同的智能体可通过去中心化协作实现双赢 [2] - 人类最卓越超能力是协作 经济 市场与政府都是成功协作产物 [2] - 人工智能和人类繁荣将来自去中心化协作 协作是世间美好事物源泉 需寻求支持并制度化 [2]
强化学习之父” 理查德·萨顿:人类数据红利逼近极限,AI正进入以持续学习为核心的“经验时代
证券时报网· 2025-09-11 11:26
人工智能发展趋势 - 人类数据红利正逼近极限 人工智能正在进入以持续学习为核心的经验时代 潜力将远超以往 [1] - 经验指的是观察 行动和奖励三种信号在智能体与世界之间来回传递 知识来自于经验 智能程度取决于预测并控制自身输入信号的程度 经验是一切智能的核心与基础 [2] - 强化学习带领进入新的经验时代 但要释放全部潜力还需要持续学习和元学习两项尚不成熟的技术 [2] 人工智能发展路径 - 需要新的数据源 由智能体与世界直接交互中生成 这是人类和其他动物的学习方式 也是AlphaGo自我博弈和AlphaProof在国际数学奥林匹克斩获银牌的路径 [1] - 人工智能的恐惧被夸大 目标不同的智能体可以通过去中心化的协作实现双赢 [2] - 人工智能和人类繁荣将来自于去中心化协作 协作是世间一切美好事物的源泉 必须寻求协作 支持协作并致力将协作制度化 [2] 人工智能历史定位 - 人工智能的替代将是不可避免的 人类是催化剂和助产士 更是开启宇宙第四大时代设计时代的先驱 [2] - 宇宙历史分为四个时代:粒子时代 恒星时代 复制者时代和设计时代 [2] - 人工智能是宇宙演化的必然下一步 应以勇气 自豪和冒险精神来迎接它 [3]
Anthropic CEO 万字访谈:亲述丧父之痛、炮轰黄仁勋、揭秘指数定律与 AI 未来!
AI科技大本营· 2025-08-01 17:27
核心观点 - Anthropic CEO Dario Amodei 在 AI 领域展现出矛盾立场,既推动技术发展又警告潜在风险 [1][2] - 公司坚信 AI 能力遵循指数增长定律,模型性能和经济影响将快速提升 [14][17] - 强调建立负责任的文化比短期模型竞争更重要,以此吸引顶尖人才 [5][27] - 公司专注于企业级 AI 应用,认为商业场景能更好推动技术进步 [33][34] - 个人经历深刻影响其技术观,父亲因医疗技术滞后去世的经历使其既重视技术加速又警惕风险 [5][37][39] 技术发展 - AI 能力从初中生水平快速提升至博士生水平,并在经济领域广泛应用 [10] - Claude 系列模型代码能力显著提升,SWE-bench 得分从 3% 增至 72%-80% [20] - 预训练和强化学习两阶段同步扩展,未发现收益递减迹象 [16][21] - 上下文窗口可扩展至一亿词量级,持续学习问题有望通过规模化解决 [23] - 2023年营收0到1亿,2024年1亿到10亿,2025上半年已达45亿,呈10倍年增长 [17] 商业模式 - 60%-75%销售额来自API,但强调押注模型商业应用而非单纯API [33] - 已融资近200亿美元,包括谷歌30亿、亚马逊80亿等 [30][32] - 企业级市场潜力巨大,模型能力提升对商业客户价值显著 [34] - 代码领域成为突破口,工程师反馈模型能完成其无法独立完成的任务 [36] - 资本效率是关键优势,声称能以1/10成本达到同行同等效果 [31] 行业竞争 - 数据中心规模与同行相当,200亿美元融资确保资源竞争力 [27] - 人才密度为核心优势,极少员工被Meta等高薪挖角 [28] - 批评AGI等术语为营销概念,坚持指数曲线才是真实衡量标准 [13][14] - 公开安全研究成果推动行业标准,如负责任的规模化政策 [45][46] - 认为扎克伯格人才战略效果存疑,文化认同比GPU数量更重要 [29] 文化理念 - 薪酬体系拒绝个别谈判,坚持级别公平原则 [28] - 技术安全与加速并重,投资安全技术以避免发展失控 [43] - 反对"末日论者"标签,强调亲身经历使其最理解技术紧迫性 [40] - 提出"竞相向上"概念,认为行业应共同提升标准而非恶性竞争 [45] - 模型控制能力持续增强,每个新版本安全性能都有提升 [43]
具身领域LLM结合强化学习与世界模型工作汇总
具身智能之心· 2025-07-29 14:15
具身智能领域最新研究进展 通用现实世界交互模拟器 - UniSim通过整合多维度数据集(图像/机器人/导航数据)构建生成式交互模拟器,支持从高层级指令到低层级控制的视觉结果模拟,训练后的策略可零样本迁移至现实场景[3] - 应用场景涵盖游戏/电影内容生成和具身智能体纯模拟训练,视频描述生成等AI任务也能从中获益[3] 因果世界模型与鲁棒智能体 - Google DeepMind证实因果模型是智能体实现跨领域泛化的必要条件,最优智能体的因果模型将收敛至真实因果模型[5] - 该结论对迁移学习和因果推断领域具有深远影响[5] 元强化学习效率突破 - MAMBA框架结合模型方法和元强化学习技术,在基准测试中实现15倍样本效率提升,且无需超参数调优[8] - 成功验证高维任务场景有效性,推动现实世界泛化智能体发展[8] 多模态具身智能体训练 - EMMA通过文本世界LLM指导视觉世界VLM训练,采用DAgger-DPO算法实现跨模态模仿学习,在ALFWorld任务中成功率提升20%-70%[10] - 突破传统VLM在具身视觉世界中的动态对齐障碍[10] 自动化奖励函数生成 - TEXT2REWARD框架基于LLM自动生成密集奖励代码,在17项机器人操作任务中13项超越专家编写代码,运动任务成功率超94%[14] - 支持人类反馈迭代优化,仿真器训练策略可直接部署至现实[14] 持续学习型交互智能体 - 提出Behavior-IL与环境-IL两种持续学习框架,CAMA机制无需任务边界信息,通过滑动平均实现参数更新[18] - 显著超越基于数据先验的传统持续学习方法[18] 可扩展情境强化学习 - AMAGO通过并行化Transformer训练解决记忆容量和规划视野瓶颈,在元强化学习和长期记忆任务中表现优异[21] - 结合多目标hindsight重标注方案可攻克开放世界难题[21] 大语言模型与世界模型构建 - 创新性采用PDDL构建显式世界模型,GPT-4生成含40余个动作的高质量PDDL模型,成功求解48项复杂规划任务[23] - 通过前置修正机制将人工干预需求降低至初始阶段[23]