Nvidia-刚刚，GPT-5.5发布，更强更快更贵，内测英伟达工程师：失去它像被截肢

GPT-5.5模型发布与核心性能 - OpenAI发布新型智能GPT-5.5，官方定位为面向实际工作和智能体的新型智能 [1] - 与上一代GPT-5.4相比，新模型在代码、知识工作、科学研究三个领域性能全面领先 [4] - 在真实生产环境中，GPT-5.5的逐token延迟与GPT-5.4相当，但完成相同任务所需token更少，实现了效率更高且功能更强大，打破了以往模型升级“更强”与“更慢”打包出现的规律 [9][10] 编程能力显著跃升 - 编程是GPT-5.5提升最显著的领域，能够自主拆解、执行和检查复杂编程任务 [12] - 在Terminal-Bench 2.0（衡量复杂命令行工作流的测试）中，GPT-5.5得分82.7%，高于GPT-5.4的75.1%和Claude Opus 4.7的69.4% [13][14] - 早期测试显示，GPT-5.5展现出真正的“概念清晰度”和高级推理能力，能够独立解决此前GPT-5.4无法处理的编程问题，其自主性和推理能力被多位高级工程师认为明显强于GPT-5.4和Claude Opus 4.7 [15][16][18] 知识工作与科学研究应用 - 在知识工作基准测试GDPval上，GPT-5.5获得84.9%的分数，比Claude Opus 4.7高出4.6个百分点 [22] - 在最难的数学基准测试之一FrontierMath Tier 4中，GPT-5.5 Pro得分39.6%，是Claude Opus 4.7（22.9%）的近一倍 [23] - GPT-5.5在科研中被定位为“研究伙伴”，能进行多轮深度对话、批改论文并提出新方案，甚至在纯数学核心领域（如Ramsey数问题）做出了被形式化验证工具Lean确认的原创性贡献 [25][26][27] 与英伟达的深度合作与系统优化 - OpenAI与英伟达进行了前所未有的合作，GPT-5.5与英伟达GB200、GB300 NVL72系统是联合设计的，实现了从训练到部署的深度协同 [2] - GPT-5.5驱动的Codex系统通过分析生产流量数据，自主编写了一套自适应的负载均衡分区启发式算法，使token生成速度提升了超过20% [30][31] - 性能突破源于推理系统的整体重构以及模型参与自身基础设施优化的双重效应 [32] 市场影响与未来展望 - GPT-5.5的价格相比前代翻倍 [11] - 其上下文窗口已升级至400K [12] - OpenAI内部超过85%的员工每周使用Codex进行工作 [22] - OpenAI预计在GPT-5.5之后，模型发布节奏将加快，公司首席科学家认为短期内将看到“相当显著的进步”，中期将有“极其显著的进步” [34][35][37]