Workflow
人工通用自主性(AGA)
icon
搜索文档
你聪明,它就聪明——大语言模型的“厄里斯魔镜”假说
36氪· 2025-09-12 09:54
神经网络研究历史与突破 - 20世纪80年代,神经网络研究面临多层神经网络学习算法的关键瓶颈,传统算法难以解决训练问题[1] - 特伦斯·谢诺夫斯基与杰弗里·辛顿合作将物理学中的玻尔兹曼分布和统计物理概念引入神经网络研究,历时三年在1986年获得突破,发现了一种用于训练玻尔兹曼机权重的学习算法[1] - 该突破打破了神经网络研究的僵局,并催生了效率更高的反向传播算法,为现代神经网络技术奠定基座[1][2] 大语言模型能力评估与“厄里斯魔镜”假说 - 大语言模型的表现高度依赖提示词,提示是一种能够显著影响模型后续输出的技术手段,提示的不同造成结果显著差异[10] - 在提供清晰社会互动框架的提示下,模型可展现事实理解、社会逻辑推演和多层级心智理论建模能力,但这本质是对人类社交问题思考方式的统计拟合,而非真正拥有心智理论[11] - 当提示词未提供合理语境时,模型因训练数据缺乏相关内容,可能生成荒诞回答,但通过调整提示(如引导模型进行事实自检)可显著改善回答质量[12] - 大语言模型如同“厄里斯魔镜”,能够映射对话者的知识水平、信念体系和认知期望,其智能表现与用户的智慧相关[13][14] 下一代模型发展方向与挑战 - 实现人工通用自主性需要补充具身化模块,使模型能与物理世界交互,例如通过与大语言模型与机器人控制系统融合[16] - 模型需发展长期记忆与持续学习能力,开发类似人类海马的功能模块,以克服当前记忆容量有限的不足[17] - 模型缺乏类似人类儿童期和青春期的发育过程,预训练是“批量式”而非“渐进式”,导致对基础概念的感知根基薄弱[18] - 当前模型的反馈学习存在时机滞后和多样性不足的缺陷,下一代模型可能需要更长、更扎实的“儿童期”,在预训练早期嵌入反馈并增加反馈场景多样性[19][20] 行业应用与多模态进展 - 多模态融合推理能力提升,如谷歌Gemini 2.0实现视频生成与工业级3D建模无缝衔接,将汽车制造产线切换时间从72小时压缩至2小时[22] - OpenAI的o3模型在数理推理任务中准确率大幅提升,并支持端到端工具使用能力训练,可完成复杂报告撰写等高阶任务[22] - 华为盘古3.0的“五感诊断模块”整合多模态指标,使癌症早期筛查准确率达97%,并在三甲医院实现全流程AI辅助诊断[22] - 通用类Agent呈现双路径发展,多智能体系统成为新范式,正在重构工作流,例如埃森哲的财务智能体和安永的税务Agent可提升任务处理效率达50%[22] 人工智能与神经科学的相互促进 - 人工智能与神经科学的相互促进是核心主题,围绕“智能”和“理解”的争论类似历史上关于“生命本质”的辩论[23] - 通用人工智能预示着一种对生命实在的无限逼近,机器学习的进步可能催生类似DNA结构之于生物学的全新概念框架,为领域带来根本性突破[23]