Workflow
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
量子位·2025-08-18 14:55

模型推理范式的转变 - GPT-5是AI领域的重大范式转变,作为OpenAI第一个混合模型,旨在弥补GPT系列与AGI的距离[5] - 技术层面从文本生成转向强化学习的推理范式,在现实世界中试错并获取反馈[6] - 新范式借助强化学习让模型在推理过程不断生成数据并重复训练,将现实世界观测结果反馈到模型中[13] - 强化学习只需从10到100个任务中学习复杂行为,相比预训练所需的数十万个示例大幅减少数据需求[14] 计算能力决定AGI开发上限 - AGI开发的主要瓶颈在于计算能力,计算量直接决定AI研究的速度与深度[16][17] - GPT-5的强化学习范式需要模型进行数万次尝试才能学会一项任务,消耗巨大计算量[18] - 计算被视为基本燃料,可将能量转化为存储在模型权重中的势能[19] - 最终AGI可能是一个模型管理器,结合小型本地模型与大型云推理器实现自适应计算[21] 模型落地与生产化 - AGI的真正目标是让大模型在企业和个人的工作流里长驻,手段是通过Agent封装模型能力[7][27] - 模型被封装成可审计的服务进程,设计双层结构的"纵深防御"保证可控性[29][31] - 通过后训练去除不受欢迎的"人格",并通过公开竞技场实时评分实现与社会偏好的协同进化[33] - 轻量级开源作为第二驱动力,开发者沉淀工具链将默认采纳OpenAI技术栈[36][37] 行业应用与未来展望 - 各行业存在大量未开发机会,建议开发者深入行业一线理解细节后用AI填补真正缺口[39][40] - 2045年愿景包括"多星际生活"与"真正的丰裕社会",技术加速度使科幻情节具备可行性[42][43] - 计算资源将成为稀缺资产,人们会为更高分辨率、更长思考时间或更复杂体验追求更多算力[43] - 当前是技术发展最好时机,AI渗透一切行业带来倍增的机遇[46][47]