Workflow
系统2思维
icon
搜索文档
大历史中的超能力|荐书
腾讯研究院· 2025-07-18 16:18
生物智能演化历程 - 犬齿兽作为哺乳动物祖先在2.6亿年前出现,凭借温血特性获得夜间活动优势,但面临食物短缺挑战[1] - 哺乳动物在1亿年前演化出新皮质,具备想象力和短期计划能力,形成"谋定后动"的生存策略[2][3] - 6600万年前小行星撞击事件导致恐龙灭绝,哺乳动物凭借体型优势和洞穴庇护实现生态位跃升[3] 大脑智能五次突破 - 第一次突破是5.5亿年前原始大脑的条件反射功能,仅需数百神经元即可实现利弊权衡和情感判断[4] - 第二次突破是脊椎动物强化学习系统,通过多巴胺机制量化目标价值并激发好奇心[4] - 第三次突破是哺乳动物新皮质带来的想象力和慢思考能力,实现系统2思维[5] - 第四次突破是灵长类心智理论能力,可模拟他人意图并发展政治行为,附带模仿学习和长期计划能力[6] - 第五次突破是人类语言系统,实现复杂知识传承和文明爆发[6] AI技术对应发展 - 强化学习使AI具备过程奖励机制,如AlphaZero通过棋步评估提升决策质量[5] - 大语言模型实现文本生成相当于想象功能,推理模型则体现系统2思维[5] - 截至2025年初AI在心智理论方面尚未成熟,智能体自我计划能力有待突破[6] - AI语言理解已超越简单语料背诵,能编码解码人类抽象规则[7] 家用机器人进化案例 - K1仅具备反射反应,K2通过强化学习实现试错优化[9] - K3搭载新皮质芯片获得数字孪生能力,可预判物理路径[9] - K4发展心智理论,能解读情感动机并调整行为策略[9] - K5将掌握语言沟通和抽象知识理解能力[9] 未来突破方向 - 第六次突破可能涉及人机结合,AI或率先实现跨模态感知和自我迭代[11] - 历史表明突变常引发链式反应,如光合作用导致大氧化事件和生物灭绝[12][13] - 陆地植物繁盛引发全球变冷,推动动物登陆进化[14] - 气候变迁促使人类大脑体积增大和社会协作强化[15]
新范式来了!新能量模型打破Transformer++扩展上限,训练扩展率快35%
机器之心· 2025-07-07 12:48
核心观点 - 研究提出基于能量的Transformer(EBT)模型,通过无监督学习实现系统2思维(慢速思维)能力,突破传统Transformer在复杂推理任务上的局限性 [9][10] - EBT在语言和图像任务中展现出显著优势:语言任务性能提升29%,图像去噪PSNR最高提升3.5,同时计算量减少99% [12][81][83] - 模型具备跨模态泛化能力,在分布外数据上表现尤为突出,预训练扩展速率比Transformer++最高提升35% [11][14][46] 技术原理 - EBT通过能量函数为输入-预测对分配能量值,采用梯度下降优化至最低能量状态模拟思考过程 [17][18][21] - 引入三种关键正则化技术:重放缓冲区、Langevin动力学变体、随机化梯度步长,确保能量曲面平滑性与凸性 [25][26][27][28] - 设计两种架构变体:解码器EBT(类似GPT)和双向EBT(支持掩码建模) [32][33] 性能表现 语言任务 - 扩展性全面超越Transformer++:数据效率提升35%,参数/FLOPs效率更高,预期千倍规模下优势更显著 [11][44][47] - 思考机制带来29%性能提升,自我验证增益从4-8%增至10-14%,且随训练规模扩大持续增强 [55][60][61] - 下游任务泛化能力更强,GSM8K困惑度降低6.3,BB Math QA降低7.2 [73][74] 视觉任务 - 图像去噪PSNR达27.25(比DiT高0.67),OOD噪声处理PSNR提升3.73,MSE降低413.5 [82][83] - 视频学习扩展速率快33%,SSV2数据集验证损失下降更显著 [76][78] - 仅需1%前向传播次数即可达到DiT同等去噪效果,PSNR提升速率更高 [86][88] 创新价值 - 首次实现无监督系统2思维建模,突破模态/问题依赖性限制,为AGI发展提供新范式 [8][10][15] - 能量机制自动捕捉预测不确定性(如文本token难度、视频帧可预测性) [63][65][80] - 计算效率革命性提升:图像任务减少99%计算量,语言任务优化多步推理 [83][88][92]