超临界学习

搜索文档
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
量子位· 2025-08-18 14:55
模型推理范式的转变 - GPT-5是AI领域的重大范式转变,作为OpenAI第一个混合模型,旨在弥补GPT系列与AGI的距离[5] - 技术层面从文本生成转向强化学习的推理范式,在现实世界中试错并获取反馈[6] - 新范式借助强化学习让模型在推理过程不断生成数据并重复训练,将现实世界观测结果反馈到模型中[13] - 强化学习只需从10到100个任务中学习复杂行为,相比预训练所需的数十万个示例大幅减少数据需求[14] 计算能力决定AGI开发上限 - AGI开发的主要瓶颈在于计算能力,计算量直接决定AI研究的速度与深度[16][17] - GPT-5的强化学习范式需要模型进行数万次尝试才能学会一项任务,消耗巨大计算量[18] - 计算被视为基本燃料,可将能量转化为存储在模型权重中的势能[19] - 最终AGI可能是一个模型管理器,结合小型本地模型与大型云推理器实现自适应计算[21] 模型落地与生产化 - AGI的真正目标是让大模型在企业和个人的工作流里长驻,手段是通过Agent封装模型能力[7][27] - 模型被封装成可审计的服务进程,设计双层结构的"纵深防御"保证可控性[29][31] - 通过后训练去除不受欢迎的"人格",并通过公开竞技场实时评分实现与社会偏好的协同进化[33] - 轻量级开源作为第二驱动力,开发者沉淀工具链将默认采纳OpenAI技术栈[36][37] 行业应用与未来展望 - 各行业存在大量未开发机会,建议开发者深入行业一线理解细节后用AI填补真正缺口[39][40] - 2045年愿景包括"多星际生活"与"真正的丰裕社会",技术加速度使科幻情节具备可行性[42][43] - 计算资源将成为稀缺资产,人们会为更高分辨率、更长思考时间或更复杂体验追求更多算力[43] - 当前是技术发展最好时机,AI渗透一切行业带来倍增的机遇[46][47]
GPT-5首次会推理,OpenAI联创曝AGI秘诀,超临界学习吞噬算力,2045金钱无用?
36氪· 2025-08-18 07:50
GPT-5技术突破 - GPT-5是OpenAI首个混合模型,通过路由器在推理模型与非推理模型间自动切换,降低使用复杂度[3] - 模型在数学、编程、物理等高智力任务上表现质变,能写出与国际奥林匹克竞赛(IMO/IOI)优秀人类相当的证明[3][5] - 物理学家反馈GPT-5的推理过程可重现数月研究成果,表明其已成为科研合作者而非单纯辅助工具[7] 技术范式转变 - 从GPT-4的"预训练+推理"转向"推理-反馈-强化学习"动态模式,这是实现可靠AGI的唯一途径[3][7] - 模型从静态训练迈向动态推理,通过"测试想法-获得反馈-强化学习"循环缩小与AGI差距[7] - 未来模型不再是"一次训练+无限推理",而是边用边学的"推理+基于推理数据的再训练"模式[3][8] 超临界学习与算力需求 - 算力增加10倍至10000倍时将触发超临界学习,模型不仅能掌握任务还能推导二阶、三阶效应[8][10] - 算力是唯一稀缺资源,OpenAI正在建造"星际之门"超级集群以扩张基础设施[19][20][21] - 算力被比作能量:预训练将算力转化为潜在智力,推理将智力释放为动能[20] 工程实践与开发策略 - 开发者需构建AI友好型代码库(模块清晰、单元测试完整、文档详尽)并拆解任务由多智能体并行完成[13] - 需积累Prompt库探索模型边界,但Prompt非唯一正确答案而是发挥创造性的测试[13][14] - 模型应视为开发团队而非单一工具,可远程异步工作或实时协作,且能无限复制[14][15] 行业应用与未来展望 - AI在生物领域已实现DNA建模达到GPT-2水平,人类语言与生物语言对神经网络无本质区别[10] - 2045年可能进入物质丰饶时代,AI生成一切或使金钱失去意义,算力将成为新稀缺资源[24][26] - 医疗、教育等行业存在大量"未被采摘的果实",AI应用空间无比广阔[24]