模型迭代

搜索文档
26天倒计时:OpenAI即将关停GPT-4.5Preview API
36氪· 2025-06-18 15:34
近日,OpenAI向开发者发了一封邮件,宣布将于7月14日正式移除 GPT-4.5 Preview API。 图注:OpenAI邮件。图源网络 对于那些已经将GPT-4.5深度集成到自己产品或工作流中的开发者来说,这无异于一次震撼。他们必须在不到一个月的时间内,从OpenAI提供的近40个模 型中,重新寻找一个替代品。 为什么非关不可? 许多人将矛头指向了高昂的计算成本。毕竟,一个性能优越、但商业上不划算的模型,在任何一家公司的账本上都不会长久。 图注:GPT模型一览 GPT-4.5 API 定价高达 75 美元 / 百万输入 tokens,150 美元 / 百万输出 tokens,几乎是 GPT-4.1 的多倍。 OpenAI官方称,这次移除计划早在4月发布GPT-4.1时就已公布。GPT-4.5从始至终都是一个"实验性"产品,其使命是为未来的模型迭代提供经验,尤其是 在创意和写作的细微之处。邮件只是按计划发送的提醒。 不够,GPT-4.5 预览版将继续作为选项,通过应用程序顶部的下拉模型选择菜单,提供给个人 ChatGPT 用户使用。 图注:用户表示GPT-4.5是最喜欢的模型之一。 最近,OpenAI公 ...
AI算力大集群:继续Scaling
2025-06-16 00:03
AI 算力大集群:继续 Scaling20250615 摘要 市场对 AI 算力需求存在预期差,美股季报显示微软、Meta 和 Amazon 资本开支超预期,预示 2025 年下半年 AI 叙事逻辑将重塑,模型迭代或 成关键。 AI 算力集群前景乐观,预计 2025 年上半年推理需求上升,下半年训练 需求增加,A 股市场预期将提升,NVMe 链、SATA 链和光互联等标的 值得关注。 中美 AI 发展差距或将拉大,取决于未来一年大模型迭代路径。预训练和 利用大集群发展大模型仍是方向,2025 年 Q3 将是关键时间节点。 2025 年 Q3 是新一轮 AI 模型迭代起点,训练投入增加,市场共识或在 Q4 形成,2026 年 Q1 推理需求有望增长,可通过观察客户量预测未来 节奏。 集群在 AI 模型迭代中作用关键,尤其处理大规模计算任务。光互联技术 受关注,但 DeepSpeed 的出现标志着算力通缩逻辑开启,降低了对大 型集群的依赖。 Q&A 未来 AI 算力需求的趋势如何? 未来 AI 算力需求将显著增长,无论是训练端还是推理端。当前市场主要反映的 是推理需求,但训练需求也会逐步增加,成为新一轮 AI 算 ...
美股半导体:AI算力能否创新高?
2025-05-18 23:48
纪要涉及的行业或者公司 - **行业**:美股半导体行业、AI 算力行业、晶圆代工行业、AI 产业、集成电路设计领域 - **公司**:英伟达、台积电、博通、Intel、Carly、Marvell、腾讯、阿里、OPIXI、MOI、PCI、高通 纪要提到的核心观点和论据 1. **美股半导体行业 AI 算力表现及影响因素** - 表现相对较弱,财务报表数据不符合 2025 年美股 AI 叙事逻辑,收入端未加速增长 [2] - 压制算力创新高因素包括预训练见顶、Deepseek 致计算需求通缩、爆款应用商业化慢、关税影响大厂资本开支预期 [2] 2. **过去一年美股半导体行业 AI 算力变化** - 2024 年 6 月和 12 月 GPU 和 ASIC 创新高,后产量横盘半年多,2025 年 1 月开始下跌 [3] - 摩尔定律变缓,英伟达 GB200 节奏放缓影响市场预期 [3] 3. **AI 应用与 AI 算力公司走势** - 2025 年一季度到 4 月底走势一致下跌,应用跌幅大,算力公司跌幅稍少 [5] - 龙头公司如英伟达、台积电、博通等反弹强劲 [5] 4. **未来美股半导体行业与 AI 相关领域发展预测** - 受宏观变量和企业业绩双重影响,目前财务报表增速放缓,训练和推理需求未提升或压制发展 [6] - 宏观经济稳定和企业业绩改善有望推动进一步增长,龙头公司反弹超预期 [6] 5. **过去两三周 AI 算力板块股价变化影响因素** - 宏观变量:美国科技企业在中国获大量订单,提升需求预期 [7][8] - 业绩指引:大厂资本开支和下游客户强劲指引使股价稳住反弹 [8] - 中观产业因素:相关公司获潜在订单,积极影响市场预期 [8] 6. **AI 算力板块未来发展关注点** - 宏观变量:关注全球经济环境及政策对科技行业影响 [12] - 中观产业变化:关注科技巨头重要发布、季报,台积电和 Intel 先进制程进展 [9][12] 7. **市场对晶圆代工需求节奏关注点** - 关注未来两三个季度需求节奏,观察 NVIDIA 的 GP300 交付及 H20 供应受限影响 [4][13] - H20 供应受限预计损失 55 亿美元,影响 NVIDIA 今年收入 [4][13] 8. **AI 产业资本开支及其增速** - 算力需求稳定,大厂资本开支同比增速预计仍达 30%以上,但增速回落 [4][16] - 受供给端因素、对中国特供产品等影响,下半年资本开支调整未确定 [16] 9. **大模型迭代路径对算力需求影响** - 参数量和数据集变大增加算力需求,推理时间和并行计算在推理或后训练环节增加算力要求 [17] 10. **深度学习并行计算方案现状及未来发展** - 现有专家并行和通信并行方案节省通信、提高效率,但非下一代模型所需 [19] - 预计 2025 年底前后找到预训练模型迭代路径,产业界未达成共识 [19] 11. **未来 2 - 3 个季度 AI 算力需求变化预期** - 训练需求可能出现向上拐点,国内大厂关注推理需求,算法优化降低算力依赖 [20] - OPIX、MOI 和 PCI 等公司模型迭代重要,2025 年四季度前后训练新技能发展影响算力需求 [20] 12. **AI 算力公司股价走势及估值预期** - 受宏观变量、中观产业变化和微观企业业绩影响,中观产业变化更重要 [25] - 2025 年上半年估值提升压力大,下半年或改善并切换到 2026 年估值预期 [25] 13. **训练和推理算力需求及博通公司表现** - 2025 年下半年推理算力需求上升,训练算力需求不确定 [26] - 博通表现取决于训练和推理算力需求同步增长,信息明朗后股价或上涨 [26] 14. **美股 AI 算力领域未来关注变量** - 关注宏观、中观和微观企业业绩变量,未来一两个季度中观产业变化重要 [27] - 三季度难见新模型演绎路径,四季度前后或清晰 [27] 其他重要但是可能被忽略的内容 1. **台积电扩厂进展**:2025 年预计增加九个新厂,下半年 2 纳米工艺量产,3 纳米工艺满产,显示对未来 AI 算力需求乐观 [9] 2. **Intel 晶圆代工发展**:新任 CEO 推动先进制程发展,2025 年 18A 制程量产,若突破未来表现值得期待,有潜在增长空间 [11] 3. **近期重要事件**:华盛轩演讲、英伟达季报、谷歌 IO 大会、高通发布第四代骁龙产品、谷歌预计发布全新安卓系统等 [21] 4. **博通和 Marvell 季报影响**:博通股价接近前高,Marvell 因市场格局和订单问题股价低,其季报指引影响股价反弹潜力 [22] 5. **ComputeX 大会及 AI PC 发展**:去年核心是 AI PC,发展未达预期,今年关注其发展方向,未来 1 - 2 个月端侧技术或有变化 [23] 6. **中东订单对 NVIDIA 影响**:中东是全球算力分布前三区域,订单虽今年量不一定大但潜在量多,影响短期算力需求 [15]
速递|GPT-4时代谢幕,OpenAI全面启用GPT-4o,GPT-4.1被曝近期发布
Z Potentials· 2025-04-12 11:16
文章核心观点 OpenAI将从ChatGPT中淘汰GPT - 4,自4月30日起由GPT - 4o全面取代,GPT - 4仍可通过API使用,GPT - 4退役或紧随ChatGPT新模型发布 [1][2] 分组1:GPT - 4相关情况 - GPT - 4于2023年3月推出,应用于ChatGPT及微软网页版Copilot聊天机器人,多个版本具备多模态能力 [1] - 据传GPT - 4训练成本超1亿美元,2023年11月其继任者GPT - 4 Turbo问世 [1] - GPT - 4是OpenAI与出版商版权争议核心模型之一,出版商指控其未经同意使用数据训练,OpenAI主张合理使用原则免责 [2] 分组2:GPT - 4o相关情况 - 在直接对比评估中,GPT - 4o在写作、编程、STEM等领域超越GPT - 4,近期升级优化了指令遵循、问题解决及对话流畅性,是GPT - 4自然继任者 [1] 分组3:技术突破及新模型情况 - 得益于GPT - 4.5技术突破,重建GPT - 4大模型所需团队规模从数百人缩减至5 - 10人,公司已突破“算力制约”瓶颈 [2] - OpenAI正在准备一系列名为GPT - 4.1的模型,包括GPT - 4.1 - mini、GPT - 4.1 - nano和GPT - 4.1,还有o3“推理”模型和o4 - mini新推理模型 [2]