Workflow
全球AI放缓了吗?关注潜在变化
2025-04-15 08:58

纪要涉及的行业 AI 产业 纪要提到的核心观点和论据 1. 产业进展 - 大模型架构预计年底前后升级,可能采用双架构模式,在 Transformer 基础上增加 CNN、GNN 等架构,以突破现有瓶颈,增强预训练效果,提升整体计算能力需求[2] - AI Agent 发展加速,具备自我执行能力的 Agent 在特定场景下有望于今年下半年实现连续复杂或简单任务,但核心挑战在于提高多步执行的准确率,影响推理算力需求增长[2] - 算力发展存在分歧,市场对训练算力需求预期弱化,推理算力需求未显著增长,处于青黄不接阶段,双架构模型推出可能在今年下半年至年底前后重新提升训练算力需求,超出市场预期[2] 2. 大模型进展 - 从去年 9 月以来,全球大模型进展围绕后训练展开,预训练环节进展不明显,目前大模型参数量约 2 万亿个参数,数据集量级约 15 到 20 个 TB,最大集群规模为 20 万卡,限制了大模型能力提升,提高大模型能力主要依赖 fine - tuning[4] - 提高大模型能力的方法包括架构创新和数据集扩展,预计今年年底前后出现新架构,通过思维链产生的数据和合成数据可增加数据集,但有效数据类型及针对环节仍需探索,到明年上半年参数量大概维持在几万亿个参数量级,20 万卡集群足够满足需求[5] 3. 大型互联网公司数据中心建设意愿 - 大型互联网公司对建立更大数据中心意愿不强,因参数量维持在几万亿个参数时,现有 20 万卡集群基本足够,除非出现重大突破,否则短期内不会大规模投入建设新的数据中心[2][6] 4. 大模型架构发展趋势 - 当前大部分模型基于传统规模架构,单一架构在数据集和参数量增加方面达到瓶颈,业界开始探索双架构可能性,今年到明年双架构可能成为产业共识,各大厂商预计年底前后推出相关大模型[7] 5. 各大厂商重点 - 今年各大厂商更多关注后训练,如 OPTI 专注后训练,Spie 重点开发 agent 技术,谷歌重心放在医药研发和为互联网用户提供高效服务,推理占比超 90%,主要竞争后训练领域,通过提升 AGC 能力来增强强化学习[9] 6. 算力需求影响 - 算力需求受训练和推理影响,目前市场对训练算力需求预期弱化,推理算力需求在爬坡中,预计今年下半年到年底前后,双架构发展及相关模型推出将使训练带来的算力需求重新上升并超出市场预期[10] - 未来三个季度内,大规模双架构模型发展预计带来更高算力需求,今年底前后双架构发展将显著提升整体计算能力需求,今年预序列变化不大,GPT - 5 可能比预期更晚发布[11] 7. 推理和多模态技术关键因素 - 推理能力提升主要依赖 agent 的能力,多模态技术若无强大推理能力应用效果受限,算力需求预期增长主要取决于 agent 的发展速度,关注 agent 何时能实现突破是关键[12] 8. 市场对算力需求预期及科技公司资本开支变化 - 近期市场对算力需求预期调整,微软削减数据中心租约,资本开支可能下调,谷歌资本开支强劲,一年约 750 亿美元,各大公司业务模式和算力需求结构存在差异,微软主要面向 B 端,谷歌、Meta 面向 C 端,AI 应用算力需求不同[13] 9. 不同公司算力需求差异 - 微软作为 to B 公司,算力需求规划中很大一部分用于 OpenAI 模型训练,但 OpenAI 自研 AI 芯片使这部分训练算力使用存疑,且微软与 OpenAI 关系疏远影响数据中心租约决策[14] - 谷歌推理方面算力占比高达 90%以上,年度资本开支约 700 亿美元,其中 70 亿美元用于模型训练[15] 10. 算力需求未来发展趋势 - 算力需求未来发展受年底前后预训练模型能否重新启动、agent 技术进展对推理算法的影响两个核心因素影响,各大厂商是否调整资本开支本月底季报披露后更明朗,宏观经济状况对大厂资本开支有一定影响但波动难以预测[16] 11. 新应用趋势 - 最近几个月大型模型厂商围绕 agent 展开工作,如 FP 推出 MCP 协议平台,谷歌发布 Agent to Agent Architecture 协议,通过工程化创新实现产品化成为重要方向,今年全球软件公司和大模型厂商致力于推动 agent 发展[17] 12. AI 领域 agent 技术发展情况 - AI 领域 agent 技术有进展,但应用场景有限,在定性场景中 minmax 等技术可发挥作用,在定量或严肃场景存在限制,核心问题是单步执行准确率约 90%以上,多步执行结果差异大,提高执行准确率是关键挑战,通过工程化手段已能开发出一定能力的 AI 产品[18] 13. 2025 年 AI 应用发展趋势 - 2025 年 AI 应用主要主题是 agent 技术,multi - agent 系统将成为主流,谷歌 ARA 协议允许多个 agent 交互,硅谷 MLOps 平台帮助开发者快速构建 agent,提供开源协议栈支持开发需求[19] 14. MCP 在开发 AI agent 中的作用 - MCP 类似于工具集或数据集,为开发者提供基础功能组件,发布于 2024 年 11 月,目的是方便使用 SOP Cloud 系列模型,加速 Agent 开发过程[20] 15. Agent to Agent 技术促进 multi - agent 系统发展 - A to A 技术为 multi - agent 系统协作做准备,制定统一标准使不同 agents 能够交互,通过模块化、多 agents 协作完成复杂任务,确保 agents 之间顺畅沟通,提高任务执行效率[21] 16. AI agent 未来发展路径 - AI agent 从 chatbot 过渡到 coding agent,再到 general agent,目前代码生成领域如 Codex 已实现 A 级功能,预计 2025 年 7、8 月份左右发布新的通用型 Agent,解决 AI 应用商业化和算力需求问题,提升任务执行效率[22] 其他重要但是可能被忽略的内容 1. 值得关注的公司:SunMirror 创立的 Thinking Machines 公司在推动 AI 技术发展方面有重要影响力,在多模态 AI 领域表现突出,吸引大量来自 OpenAI 的顶尖开发人员,前不久完成约 20 亿美元融资,估值达百亿级别[23][24] 2. 重要财报关注:下周阿斯麦将在周三盘前发布财报,台积电将在周四早上发布财报,四月底开始陆续有微软、Meta、谷歌等科技大厂发布季报,其资本开支数据、营收增速情况以及对下半年美国宏观经济走势的指引将影响市场预期[25] 3. 未来几个月科技领域关注因素:四月和五月是科技领域重要时期,AI 领域逐步寻找更有效迭代方式,今年主要集中在后训练,明年可能转向前训练,应用以 agent 为主,其他商业模式和业务形态需进一步观察,科技大厂的边缘化数据对判断 AI 进展有参考价值[26][27]