技术范式转变 - 从文本生成转向强化学习推理范式 通过现实世界试错和反馈提升模型可靠性 [1][6][8] - 新范式大幅降低数据需求 预训练需数十万示例而强化学习仅需10-100个任务即可学习复杂行为 [8] - GPT-5作为首个混合模型实现推理过程持续生成数据 通过强化学习将现实观测结果反馈至模型 [4][8] 计算资源战略 - 计算能力是AGI开发主要瓶颈 计算量直接决定AI研究与发展速度深度 [3][9] - 通过扩大计算资源可突破算法壁垒 如Dota项目内核数量翻倍实现性能持续提升 [9] - 当前强化学习范式需数万次尝试完成任务 深层学习需更多计算资源实现知识体系更新 [10][11] - 计算作为基本燃料可转化为模型权重势能 训练完成后可在多任务中分摊成本 [11] 模型架构演进 - AGI将呈现模型管理器形态 结合小型本地模型与大型云推理器实现自适应计算 [11] - GPT-5采用多模型混合路由机制 通过条件语句选择推理模型(深度智能)或非推理模型(快速输出) [12] - 复合式模型根据任务需求组合不同能力成本模型 提升计算灵活性 [12] 落地应用策略 - 将模型封装成Agent作为可审计服务进程 实现与人类协作式交互且具备可控性与回滚能力 [1][13][15] - 采用双层纵深防御架构:模型内部按可信度排序指令防范注入 外部通过多级沙箱确认高危操作 [15] - 通过后训练去除不受欢迎人格类型 再通过公开竞技场实时评分实现模型与社会偏好协同进化 [15][16] 行业发展机遇 - 各行业存在大量未开发应用场景 需深入理解行业链条细节而非简单接口封装 [3][18] - 技术发展机遇随曲线陡升倍增 需保持好奇心投入新领域 [22] - 计算资源将成为未来稀缺资产 即使物质需求满足仍需要更多算力支持高分辨率与复杂个性化体验 [20]
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
36氪·2025-08-18 19:02