Workflow
晶体智力
icon
搜索文档
CL-Bench的故事没有结束,生成式CL-Bench:GENIUS来了
机器之心· 2026-03-02 17:03
GENIUS基准与生成式流体智力 - 文章核心观点:当前生成式多模态大模型在基于海量数据拟合的“晶体智力”上表现强大,但在需要根据新颖、动态上下文进行即时推理和创造的“流体智力”上存在显著短板。GENIUS基准的提出,旨在评估和推动模型从“模仿者”向具备真正通用推理能力的“思考者”进化[7][26][27] - 从“晶体”到“流体”智力:晶体智力指运用过去学习获得知识的能力,模型通过海量数据拟合掌握了这种能力,例如生成逼真的猫。流体智力指根据当前独特、新奇情境进行“随机应变”推理的能力,这是模型迈向高价值应用和真正通用智能的关键[7] - GENIUS基准解构生成式流体智力:基准包含510个专家级样本,涵盖20个子任务,每个样本由多模态交织上下文组成,确保任务必须通过整合所有上下文线索才能解决。它从三个维度评估流体智力:1) 隐式模式归纳:考察模型从稀疏观察中捕捉潜在规律并泛化的能力[11];2) 执行即时约束:考察模型理解并执行临时、非训练分布内复杂逻辑的能力[12];3) 适应上下文知识:考察模型克服预训练“认知惯性”,适应反直觉上下文设定的能力[13] 实验结果与模型表现分析 - 晶体智力与流体智力的割裂:在12个最先进的模型上评测,量化结果显示即便最强模型(如Nano Banana Pro)在GENIUS上的平均表现也远未达到及格线,表明模型习得的知识储备(晶体智力)不能直接迁移为解决新颖问题的推理能力(流体智力)[15][17] - 预训练知识的阻力:在三大评估维度中,“适应上下文知识”的准确率普遍最低,证实模型存在严重的预训练知识阻力。例如在“反重力”任务中,模型常忽略上下文,顽固生成符合现实物理规律的图像,显示其思维僵化,缺乏在现实与想象模式间灵活切换的可塑性[18] - 故障诊断与失效原因:1) 常规推理增强策略(如思维链、测试时扩展)带来的性能提升非常有限,现有推理范式难以迁移到多模态即时生成任务[20];2) 上下文理解是核心瓶颈,引入人工编写的显式提示可提升生成质量,但部分模型在多模态交错输入下甚至出现性能回退[20];3) 生成失败主因是执行能力不足而非理解缺陷。模型在转换为视觉问答任务时成功率较高,但交错上下文的高数据密度使细粒度视觉差异难以被捕获,且模型结构设计导致理解侧的语义信息无法有效传导至生成侧[21] 方法论与改进方向 - 基于注意力的免训练增强:通过可视化分析发现,模型(如Bagel)在处理图像时注意力分布异常杂乱,包含大量噪声和随机激增,这干扰了其对上下文的理解。基于“上下文学习是隐式梯度更新过程”的理论,提出一种免训练的注意力校准机制,强制引导模型将注意力收敛于关键的视觉与语义区域。该方法能有效纠正模型的优化轨迹并带来显著的性能增益[23][24] - 总结与行业展望:GENIUS基准的提出回应了生成式AI发展的核心命题。行业需要推动模型从“晶体智能的拟合”走向“流体智能的推理”,这是生成式多模态大模型下一阶段发展的必经之路。该基准旨在为社区提供严谨的测试平台,推动模型进化为具备真正通用推理能力的“思考者”[26][27]
大脑抗衰手册:如何让你的脑力保持巅峰
虎嗅· 2025-03-28 08:06
核心观点 - 传统观点认为流体智力在25岁后开始衰退,但新研究指出思维速度可维持到60岁左右,关键在于保养得当和保持开放心态 [6][10][13] - 通过增强认知储备、接受新鲜刺激、进行脑力锻炼、保持足够社交、维持健康习惯和训练大脑秩序等方法,可以有效帮助大脑抵抗衰老,维持脑力年轻和健康状态 [16][17][29][41][48][52][60] 智力研究新发现 - 传统研究认为流体智力巅峰在25岁前后,之后逐渐衰退,45岁后加剧 [6] - 2022年《自然》研究指出,智力下降速度可能比想象慢,思维速度可维持平稳水准至60岁左右 [10] - 思维速度看似下降可能源于年龄增长后决策更谨慎,而非大脑能力衰退 [11] - 晶体智力(经验)在一生中稳步提升,即使到60岁也能维持较高平稳水平 [14][15] 增强认知储备方法 - 认知储备指通过优化神经网络资源配置,用更少资源完成相同任务,以应对可能的神经元损伤 [20][21][22] - 学习外语是提高认知储备的有效方式,双语者颞叶和顶叶更不易受损,额叶与颞叶、顶叶连通性增强 [24] - 外语学习能提升执行控制能力和注意力,增加前额叶皮层神经元连接密度,对冲年龄增长损伤 [25] - 学习两门语言可减轻大脑老化,学习更多语言效果增幅递减 [26] - 2018年研究发现音乐相关活动能有效提升记忆力和执行控制能力,刺激大脑信息加工处理 [26] - 建议培养学习外语和音乐的习惯,演奏乐器、唱歌、跳舞或多听音乐均有助益 [27][28] 接受新鲜刺激 - 任何类型的学习都对大脑有益,可通过提供新鲜刺激发挥作用 [30] - “脑力下降”感可能源于长期缺乏多巴胺导致的慢性疲劳状态,使大脑失去动力和兴趣 [31][32] - 为大脑持续提供新鲜感是刺激多巴胺分泌的关键方式 [33] - 面对新信息应选择将其内化到预测框架中,而非拒绝接受,以维持脑力 [36][37] - 建议拨出15%可用时间接触新领域,为大脑持续提供新鲜刺激和多巴胺分泌 [39][40] 进行脑力锻炼 - 电子游戏是需要多脑区协作的娱乐形式,对维持大脑活力和年轻有帮助 [42] - 射击类游戏可锻炼识别方位、记忆路线、理解环境、制定策略等能力,提升手眼协调、空间和运动能力 [42][43] - 桌游、剧本杀可锻炼阅读、理解和推理能力 [45] - 下棋、猜谜、答题有助于注意力、记忆力和模式识别能力 [45] - 话剧、戏剧表演可锻炼理解力、记忆力、表达能力和感知能力 [45] - 手工、绘画等艺术形式对专注力、想象力、表达力和协调力有长足帮助 [46] - 球类等对抗合作活动因需快速判断决策,也有助于脑力锻炼 [46] 保持足够社交 - 良好社交能提高幸福感并降低阿尔兹海默病几率,是保持身心年轻的关键因素 [48] - 长期孤独会对大脑造成不可逆损害,影响认知能力,应避免长期不与他人接触 [48] - 社交包括维持朋友联系以及参与聚会、比赛、团队体育、兴趣活动等社会性活动 [48][50] - 创造内容、分享见解、艺术创作、专业咨询等产出性活动能充分调动各脑区,维持大脑最佳状态 [50][51] 维持健康习惯 - 久坐是对身心健康危害最大的日常不良习惯,会提高多种疾病几率 [52] - 2018年研究发现久坐会降低大脑认知能力,因其不利于心脑血管循环,从而降低思考与认知能力 [53] - 久坐可能导致大脑部分脑区缺氧,长期积累可能造成神经元凋亡或神经连接破坏等不可逆后果 [53] - 运动程度更高的人,其认知能力下降速度越慢 [54] - 建议避免长时间久坐,养成多活动习惯,通过分散运动对冲久坐影响 [54] - 可进行原地跑步、上下楼梯、冲刺短跑或简单拉伸等见缝插针的运动 [55] - 与朋友参与户外运动可同时锻炼身体、社交和脑力 [56] - 散步、晒太阳也是有效的锻炼方式,有助于提高睡眠质量,从而清除大脑代谢废物,降低阿尔兹海默病几率 [57][58] 训练大脑秩序 - 2019年研究发现每天步行5000~10000步能有效增加脑容量,降低大脑衰老程度 [59] - 2012年研究发现跑步时大脑血流量增加约15%,可提升运作效率 [59] - 大脑思维能力取决于神经元连接的效率和有序程度 [60] - 可通过经常对信息进行总结、归纳、提炼来锻炼大脑,砍掉无用连接,强化高维连接 [61] - 建议通过反思和复盘来优化大脑内部连接,例如思考新问题的归类、共同点与差异点,整合知识并建立联系,总结行动经验和方法论 [62][63]