算力通胀

搜索文档
5月Call海外AI算力:当时我们看到的变化是什么?
2025-06-19 17:46
纪要涉及的行业和公司 - **行业**:海外AI算力行业、ACSL产业链、AI产业链中的PCB制造环节、光模块和光互联领域 - **公司**:微软、谷歌、NVIDIA、Meta、OpenAI、亚马逊、生益电子、沪电股份、广合科技、博通Marvell、深南电路、Zinus、ECAI、Skill AI、Cohere、Oracle 纪要提到的核心观点和论据 1. **美股AI反弹与算力需求趋势** - 微软上修全年和下一季度指引创新高,标志美股AI反弹基础[2] - 2025上半年AI算力市场训练和推理需求共振向下,下半年推理需求因TOKEN量增加向上,若训练算力增长,市场信心或恢复,且下半年两者需求将共振向上[1][9][13] - 算力通胀指各环节价值量显著增加,通缩指单位成本下降,TOKEN量需翻倍增长维持算力总需求[1][10][14] 2. **AI技术对算力需求的影响** - AI agent对TOKEN量和算力需求远超chatbot,预示推理模型发展方向[1][3] - 谷歌IO大会与微软数据验证TOKEN量加速增长趋势,显示行业显著拐点[1][4] 3. **云计算平台与算力需求关系**:大厂对未来算力需求不清晰,不敢轻易建大型集群,使云计算平台如K85产业价值提升[5] 4. **美股AI巨头反弹原因**:上季度业绩良好、AI商业化进展顺利、资本开支未减少[6] 5. **项目对算力市场的影响** - 星际之门项目专注训练,提升训练预期,但市场仍主要交易推理算力[7] - new scaling旨在打开模型能力天花板,下半年需找到下一代模型路径提升能力和应用潜力[8] 6. **市场对算力需求的误判**:市场误判训练和推理需求,认为需爆款应用带动,实际大厂改造业务已推动TOKEN量增加,当前推理需求占主导[1][16] 7. **未来AI大模型发展格局**:未来AI大模型发展格局渐明,下一代大模型引领者可能是OpenAI和XAI等,若靠大型集群驱动,谷歌等公司处次要地位[19] 8. **中美AI产业差距**:未来半年到一年,中美在AI大模型领域差距或拉大,中国缺大型计算集群,更多满足推理需求[20] 9. **公司算力投入情况** - Meta一年H1版采购量约30万张GPU卡片,价值超100亿美元;OpenAI购买全美主要云服务提供商卡片,需求仍存疑[23][24][26] - 亚马逊和谷歌自研芯片量显著增长,ECAI客户下半年推资源芯片并于明年放量[33] 10. **PCB环节变化** - 明年三家云厂商自主研发芯片用AI服务器硬件设计规格显著提升,新增PC需求价值量预计151 - 200亿元[34] - 核心标的公司中生益电子、沪电股份为第一梯队,广合股份与博通Marvell为第二梯队[35] 11. **各公司发展情况及前景** - 生益电子产能不足问题下半年部分解决,新增产能预计带来30亿产值弹性,明年盈利预期接近18亿元[37] - 沪电股份确定性强、估值性价比高,今年下半年释放产值弹性,明年盈利约45 - 46亿元,目标市值短期内或达1200亿元[39] - 广合科技逻辑类似生益电子,明年新增产能释放,2026年收入和利润预计14 - 15亿元,PE约17倍[40][41][42] 12. **光模块和光互联领域需求节奏**:光模块与PCB短期需求基本同步,光互联中CPO需求2026年显现,最快上半年,最慢下半年[43] 其他重要但可能被忽略的内容 - 市场对agent技术认知存在误解,国内感知度低,美国使用多,如Zinus海外估值超100亿人民币[31] - Marvell近期涨幅约9 - 10个百分点,需进一步分析其AI Day PPT内容[44]
AI算力大集群:继续Scaling
2025-06-16 00:03
纪要涉及的行业和公司 - **行业**:AI 算力行业 - **公司**:微软、Meta、Amazon、谷歌、OpenAI、AXIS、英伟达、博通、泰晶光天孚、Oracle、Skillz AI、DeepSeek、Gloster、X.AI 纪要提到的核心观点和论据 1. **AI 算力需求趋势**:未来 AI 算力需求显著增长,训练和推理端需求都会增加,纵向扩展规模化趋势更明显;当前市场主要反映推理需求,训练需求将成新一轮起点;4 月底起市场对 AI 算力需求存在预期差,美股季报显示微软、Meta 和 Amazon 资本开支超预期,2025 年下半年新 AI 叙事逻辑或重塑,大概率是模型迭代路径新发展 [1][2] 2. **AI 算力集群发展前景**:2025 年上半年推理需求预期上升,下半年训练需求预期增加,A股市场预期将提升;相关标的有 NVMe 链、SATA 链和光互联;若未来模型迭代依赖大集群,中美差距或拉大,中国可通过软件算法创新弥补但有不确定性,美国继续推进参数优化,各公司迭代方向各异 [1][3][4] 3. **中美 AI 领域发展差距**:可能重新拉大,取决于未来一年大模型迭代路径;方向是继续预训练并利用大集群发展大模型,2025 年 Q3 是关键时间点 [1][5] 4. **AI 模型迭代节奏**:2025 年 Q3 是新一轮 AI 模型迭代起点,训练投入增加,市场共识或在 Q4 形成,2026 年 Q1 推理需求有望增长,可通过观察客户量预测未来节奏;2026 年下半年爆款模型出现概率较大 [1][6] 5. **集群在 AI 模型迭代中的作用**:处理大规模计算任务时作用关键,模型参数量增大使对计算量、内存和通信要求增加,需更大集群支持;光互联技术受关注,但 DeepSpeed 出现标志算力通缩逻辑开启,降低对大型集群依赖 [1][7] 6. **不同公司迭代路径** - **谷歌**:预计年底推出新双架构模型,通过架构创新优化 AI 能力 [15] - **Meta**:继续卷入数据层面,拥有大量社交平台数据,但仅增加数据量提升效果有限,收购 Skillz AI 增强技术实力,内部可能有人员调整 [15][16][18] - **微软**:采取跟随策略,减少训练需求投资,转向推理战略,砍掉两个 GW 数据中心,但推理需求超预期使资本开支保持稳定 [25][26] - **OpenAI**:擅长通过增加预训练模型参数量提升效果,使用类似马斯克百万卡集群方法,2025 下半年到 2026 年该方法或成 AI 变化最大环节 [20] 7. **算力通胀与通缩逻辑** - **通胀逻辑**:每个环节性能提升导致价值量增加,如模型参数增多、数据集庞大,对单卡性能、卡间互联速度和光模块规格要求提高 [30] - **通缩逻辑**:模型变小,对集群规模要求减少,算力成本降低,DeepSpeed 出现标志算力通胀逻辑结束,开启通缩逻辑 [9] 8. **集群需求判断及发展趋势**:应基于实际算力需求,而非等待爆款产品;目前 OpenAI 和 XAI 需要大集群,微软、谷歌、亚马逊和 Meta 是否需要待定;大厂最好策略是等待新技术架构出现再建大集群,现有数据中心无法满足需求时可通过 CGI 或 ECI 互联现有数据资源解决部分问题 [28] 其他重要但可能被忽略的内容 1. **后训练阶段影响**:主要依赖强化学习算法,注重算法设计技巧,减少对大规模计算资源需求,降低模型成本,从去年 9 月到今年二季度全球大规模计算资源需求无显著增加 [13] 2. **Meta 内部观点分歧**:杨立昆和杰弗里·辛顿在大模型观点上存在分歧,杨立昆批评大模型,杰弗里·辛顿支持,这种分歧可能促使 Meta 进行管理层调整 [17] 3. **微软资本开支情况**:砍掉两个 GW 数据中心后资本开支未下降,因推理需求超预期补足训练资源 [26] 4. **中国 AI 发展路径**:因硬件基础设施限制,选择以算法优化为主的发展路径,通过异构计算和算法创新突破瓶颈,如 DeepSeek 采用稀疏架构等技术降低对硬件要求 [32][35] 5. **博通技术优势**:胖猫通信技术扩宽通信通道,增强数据同步能力,通过动态自动化负载均衡优化数据加载和处理,支撑训练过程数据处理 [36] 6. **集群架构后端网络重要性**:对带宽和卡性能要求高,是 scale up 的核心,使用 TOPO6 或更强带宽交换机芯片可扩大卡间交互带宽,对大规模集群建设整体性能优化至关重要 [39] 7. **2025 年 AI 算力市场预期变化**:上半年 A 股市场对 AI 算力、推理和训练需求预期共振向下,下半年预期共振向上,波动源于市场预期变化,实际需求一直存在且较好,上半年供给端问题导致供给不足,下半年供给恢复市场预期将改善 [40]