AIGC系列之31：Open AI o1模型发布，推理范式大范围创新！

综合评价：逻辑、代码、数学能力提升明显 - OpenAI 认为 o1 相比此前模型提升显著,因此进行系列重新命名。o1 意味着大模型将进入了一个新的扩张范式:从模型参数增大,转向强化学习的探索 [5] - o1 在机器学习测试、博士级科学问题物理、MMLU 大学数学等测试集中,相比于 4o 有明显的提升,超越了人类专家的表现,成为第一个在该基准测试中做到这一点的模型 [6][7] 能力提升主要来自于推理环节 - o1 是经过强化学习训练来执行复杂推理任务的新型语言模型,在回答之前产生一个很长的内部思维链(CoT,chain of thought) [12][15] - 通过思维链的强化学习方式,大模型可以把推理过程中的每一步思考都记录下来,并进行打分,再根据评分高低反馈给模型进行调整,从而提升智能水平 [15] 利好推理算力,教学、编程、医疗、金融等应用 - o1 的API价格和响应时间显著高于GPT-4o,推测目前o1的普遍推理成本可能是原路线的约3倍以上 [16] - o1 的推理、代码、数学能力提升,可以利好科学研究、编程开发、教育学术、医疗健康、金融等领域 [16][17][18] 后续的其它期待 - 业界仍然期待算力升级、数据丰富后,大模型在参数规模提升和多模态能力提升两条路线上进一步迭代 [19]