奥特曼首晒GPT-5实测！被曝使用超级对齐团队“遗产”

GPT-5技术进展 - GPT-5在编程领域重写编码规则，结合文本能力与推理层，模型能更合理地选择思考时机[9][10] - 具备处理真实工程问题的能力，例如重构低质量代码，并引入超级对齐团队的"通用验证器"技术[11] - 采用"证明者-验证者游戏"训练方法，通过对抗训练提升模型输出的准确性和可读性[21][24][26] 超级对齐团队技术应用 - 通用验证器通过强化学习使GPT-5保持高准确率，同时输出更清晰的推理过程[19] - 训练中划分"靠谱证明者"和"狡猾证明者"角色，验证者通过交叉熵损失最小化判断误差[25][26] - 多轮迭代后，"靠谱证明者"正确率提升，"狡猾证明者"生成错误答案的能力增强[27][31] 行业竞争与研发动态 - GPT-5在编程领域对标Claude，试图通过技术创新取得优势[9] - 超级对齐团队解散后，其技术遗产被整合到GPT-5开发中，显示公司技术路线调整[14][18] - 研发面临挑战，包括训练数据不足、预训练收益下降及性能转化落差问题[37] 市场预期与争议 - 奥特曼通过官方渠道释放GPT-5相关信息，引发市场高度关注[1][8][28] - 部分观点认为GPT-5性能提升可能有限，且存在发布后性能下降的风险[37][38] - 技术细节泄露显示GPT-5可能采用可验证性约束机制，增强输出可靠性[32]