玻尔兹曼机
搜索文档
你聪明,它就聪明——大语言模型的“厄里斯魔镜”假说
36氪· 2025-09-12 09:54
神经网络研究历史与突破 - 20世纪80年代,神经网络研究面临多层神经网络学习算法的关键瓶颈,传统算法难以解决训练问题[1] - 特伦斯·谢诺夫斯基与杰弗里·辛顿合作将物理学中的玻尔兹曼分布和统计物理概念引入神经网络研究,历时三年在1986年获得突破,发现了一种用于训练玻尔兹曼机权重的学习算法[1] - 该突破打破了神经网络研究的僵局,并催生了效率更高的反向传播算法,为现代神经网络技术奠定基座[1][2] 大语言模型能力评估与“厄里斯魔镜”假说 - 大语言模型的表现高度依赖提示词,提示是一种能够显著影响模型后续输出的技术手段,提示的不同造成结果显著差异[10] - 在提供清晰社会互动框架的提示下,模型可展现事实理解、社会逻辑推演和多层级心智理论建模能力,但这本质是对人类社交问题思考方式的统计拟合,而非真正拥有心智理论[11] - 当提示词未提供合理语境时,模型因训练数据缺乏相关内容,可能生成荒诞回答,但通过调整提示(如引导模型进行事实自检)可显著改善回答质量[12] - 大语言模型如同“厄里斯魔镜”,能够映射对话者的知识水平、信念体系和认知期望,其智能表现与用户的智慧相关[13][14] 下一代模型发展方向与挑战 - 实现人工通用自主性需要补充具身化模块,使模型能与物理世界交互,例如通过与大语言模型与机器人控制系统融合[16] - 模型需发展长期记忆与持续学习能力,开发类似人类海马的功能模块,以克服当前记忆容量有限的不足[17] - 模型缺乏类似人类儿童期和青春期的发育过程,预训练是“批量式”而非“渐进式”,导致对基础概念的感知根基薄弱[18] - 当前模型的反馈学习存在时机滞后和多样性不足的缺陷,下一代模型可能需要更长、更扎实的“儿童期”,在预训练早期嵌入反馈并增加反馈场景多样性[19][20] 行业应用与多模态进展 - 多模态融合推理能力提升,如谷歌Gemini 2.0实现视频生成与工业级3D建模无缝衔接,将汽车制造产线切换时间从72小时压缩至2小时[22] - OpenAI的o3模型在数理推理任务中准确率大幅提升,并支持端到端工具使用能力训练,可完成复杂报告撰写等高阶任务[22] - 华为盘古3.0的“五感诊断模块”整合多模态指标,使癌症早期筛查准确率达97%,并在三甲医院实现全流程AI辅助诊断[22] - 通用类Agent呈现双路径发展,多智能体系统成为新范式,正在重构工作流,例如埃森哲的财务智能体和安永的税务Agent可提升任务处理效率达50%[22] 人工智能与神经科学的相互促进 - 人工智能与神经科学的相互促进是核心主题,围绕“智能”和“理解”的争论类似历史上关于“生命本质”的辩论[23] - 通用人工智能预示着一种对生命实在的无限逼近,机器学习的进步可能催生类似DNA结构之于生物学的全新概念框架,为领域带来根本性突破[23]
21书评︱“深度学习之父”辛顿:信仰之跃
21世纪经济报道· 2025-07-31 17:32
文章核心观点 - 文章通过回顾“深度学习之父”杰弗里·辛顿的传奇学术生涯与思想转变 探讨了坚持“信仰”对于人工智能领域突破性发展的重要性 并指出脑科学与人工智能的结合是通向通用人工智能的关键路径 [1][2][11] 人物背景与早期经历 - 杰弗里·辛顿于2024年因人工神经网络的基础性发现和发明获得诺贝尔物理学奖 是2018年图灵奖获得者 被公认为人工智能之父 [1][4] - 辛顿在剑桥大学本科期间频繁更换专业 从物理学辍学 后转向生理学、哲学 最终以心理学获得学士学位 毕业后曾成为一名木匠 [4][5] - 其家族学术背景显赫 父亲是剑桥大学教授、英国皇家学会院士 曾祖父是数学家兼科幻作家 曾祖父的岳父是布尔代数的创立者乔治·布尔 [5] - 辛顿早期远离学术选择成为木匠 被认为是对家族期望压力的逃避和对权威的无意识反抗 [6] 学术转折与研究信仰 - 辛顿在阅读心理学家唐纳德·赫布的《行为的组织》后深受启发 书中“共同放电则彼此连接”的赫布法则点燃了他用仿生方法研究大脑智能的火种 [7] - 他在一个心理工作坊中喊出“我真正想要的是一个博士学位” 从而决心重返校园 进入爱丁堡大学攻读人工智能博士学位 [7] - 当时神经网络研究正处严冬 人工智能先驱马文·明斯基在其著作《感知机》中批判神经网络是“死胡同” 主张符号主义AI 辛顿的导师也转投符号主义阵营 [7] - 辛顿坚信“让人工智能真正奏效的唯一途径 是让计算方式尽量像人脑” 并认为人工神经网络能做到人脑能做的一切 [9] 研究历程与行业影响 - 在近40年的时间里 辛顿因其对神经网络的执着而承受强烈的孤独感和学界敌意 其研究曾被普遍认为没有出路 [1][9] - 20世纪80年代中期 辛顿在麻省理工学院向明斯基等人展示其神经网络模型“玻尔兹曼机”时 场面一度凝重紧张 [9] - 四十多年后 深度卷积网络在图像识别领域大放异彩 Transformer架构重塑了自然语言处理 验证了辛顿当年的信仰之跃 [11] - 辛顿选择神经网络的部分原因是受其昆虫学家父亲从生物学角度理解生命的影响 他决意通过神经网络来创造通用人工智能这一新生命 [11] 人工智能领域发展启示 - 清华大学教授刘嘉在新书《通用人工智能:认知、教育与生存方式的重构》中借辛顿的故事提出 下一代人工神经网络的发展又到了需要赌一个像辛顿当年的“信仰”的时候 [2] - 刘嘉在1997年拜访马文·明斯基后因人工智能处于第二次寒冬而错过该领域 他现在的研究方向是让脑科学和人工智能结合 认为这对通向真正的通用人工智能可能有帮助 [2] - 脑科学与人工智能被描述为DNA的双螺旋结构 存在紧密且关键的联系 [2] - 真正的信仰被比喻为克尔凯郭尔笔下的“信仰骑士” 在于跃向绝望深渊时的决断 而非对结果的确定把握 [10][11]