OpenAI o1模型发布 - OpenAI发布新型推理模型o1系列,包括o1-preview和o1-mini,性能在数学、编程等领域大幅超越GPT-4o [3][5][7] - o1采用强化学习和思维链技术,通过自我纠偏和分步推理提升逻辑能力,解题时处理字符量达6632个,是GPT-4o的4.2倍 [8][9][19][25] - 模型响应时间显著延长,o1-preview回答简单问题需32秒,是GPT-4o的10倍,且目前功能受限,开发者API调用被限制为每分钟20次 [25][29] 技术路径革新 - o1突破传统Scaling Laws瓶颈,通过增加"答题时思考"的算力分配(test-time compute)实现性能跃升,AIME数学竞赛得分达GPT-4o的4倍 [5][19][26][27] - 训练数据来源扩展至三类:公开数据集、合作伙伴专有数据和内部定制数据,研发团队规模与GPT-4o相当(212人) [21] - 模型架构可能向"推理核心+知识存储"方向演进,OpenAI暗示将把o1技术整合至下一代GPT模型 [27][29] 行业影响 - o1发布刺激英伟达股价两天累计上涨10%,缓解市场对AI进步停滞的担忧,此前英伟达市值从6月高点已下跌20% [3][4][29] - 红杉研究显示AI领域2023年投入产出差达1200亿美元,2024年可能扩大至5000亿美元,除英伟达外多数公司未实现收入大幅增长 [4] - 中国部分科技公司已暂缓基础模型训练转向应用开发,o1发布可能重启算力竞赛,OpenAI借此时机以1500亿美元估值寻求70亿美元融资 [4][6][30] 产品特性对比 - o1在数学/编程测试中表现突出:Codeforces编程竞赛成绩超GPT-4o 5.6倍,但语言创作能力弱于GPT-4o [19][22][24] - 相比GPT-4o,o1系列暂缺网页浏览、文件处理等功能,付费用户使用频次受限(每周30次o1-preview) [25][29] - 下一代o1模型在物理/化学等学科测试表现预计达到博士生水平,当前模型相当于硕士生水平 [21]
OpenAI 再次给大模型 “泡沫” 续命