英伟达B20

搜索文档
算力产业近况解读
2025-05-25 23:31
纪要涉及的行业和公司 - **行业**:算力产业、GPU 行业 - **公司**:英伟达、华为、阿里巴巴、百度、腾讯、字节跳动、寒武纪、昆仑芯、韩 5G、海光、火山引擎、智谱、讯飞 纪要提到的核心观点和论据 市场需求与前景 - **全球和国内 GPU 市场需求持续增长**:中国因贸易摩擦,依赖国产或降配版进口芯片;国际上美国生成式多模态及 AGI 技术发展、其他地区推进大模型行业落地带动算力需求[1][3] - **未来两年存在两种情景**:贸易摩擦加剧,国产芯片需求增加;关系缓和,降配版进口芯片推动多模态应用发展,无论哪种情景算力需求都增加[3] 英伟达产品情况 - **英伟达 H20 不受青睐**:降配后性能优势减少、利润下降,头部互联网公司或云服务企业倾向选择性价比更高的国产芯片,国产卡逐渐占据更多市场份额[1][4][5] - **英伟达在中国市场 GPU 卡性价比降低**:预计 2025 年再推降配版 H20 难获大量订单,仅个别急需公司可能购买[5] - **国内公司倾向 B20 而非 H20**:H20 性能下降严重,无法满足多模态推理和 agent 应用需求;B20 架构并行速度和卡间协作更佳,单机内和集群内表现损耗小[1][11] - **B 系列降配版能满足禁令要求**:H 系列因物理架构限制,缩减显存和降低计算频率会使集群表现大幅下降;B 系列架构处理好,配置低时表现损耗小[12] 国产芯片情况 - **华为升腾系列有进展但存在不足**:升腾 910C 通过 3D 空间式设计提升单机架内算力约 25%,但缺乏 Nvlink 导致数据传输速度受限[6] - **韩 5G 芯片有突破但表现欠佳**:实现单片参数技术突破,但在组网及复杂计算中表现欠佳,高可用性材料有差距[6] - **国产芯片需补足多方面**:软硬件结合能力不足、产能问题(如寒武纪无训练卡生产能力)、良品率低,导致显存、传输速度、更新迭代及产能分布存在不足[20] 国内互联网巨头自研芯片情况 - **阿里巴巴**:通过平头哥系列服务于阿里云,用于降低成本、硬件加速和 IoT 场景[7] - **百度**:通过昆仑芯推进大模型推理商业化,与飞桨开发框架适配,实现自主可控[7] - **腾讯和字节跳动**:集中于视频解码、加速及神经网络训练等领域,字节跳动还尝试与台积电合作研发高性能多模态推理芯片[7] 应用场景与算力投入 - **推理场景资源消耗接近训练场景**:2025 年多模态推理场景资源消耗与训练相差无几,特定场景推理成本超训练成本,预计 2026 年互联网公司算力投入向推理倾斜[1][8][9] - **公有云需求未显著增长**:中小企业接入大模型 API 或构建 agent 较少,市场以头部公司自有业务为主导,社会面日常 TOKEN 消耗量相对较低[10] 市场供应与租赁挑战 - **高性能计算芯片供应情况**:英伟达 H20 大部分被头部公司购买,A100 和 A800 应用场景有限,H100 和 H800 价格昂贵,小型企业难以负担,且头部公司考虑数据安全不轻易选择外部集群[17] - **企业租赁高性能芯片面临挑战**:大规模预训练需显卡集中,推理环节需求无法分散,高性能芯片大规模使用存在市场供应量和技术困难,零星或大规模租赁不可行[2][19] 多模态技术市场情况 - **多模态技术占领市场概率高**:2024 - 2025 年末市场规模预计增长 15 - 20 倍,火山引擎大模型有效 tokens 部分来自公有云供中小企业使用[14] 其他重要但可能被忽略的内容 - **字节跳动租赁情况**:租赁 IDC 和机房存放芯片,年初租赁算力用于抖音和豆包相关功能加速,为临时性非大规模租用 GPU[15][16] - **腾讯 GPU 采购困难**:今年一季度疯狂购买 GPU,二三月难买到,四月底五月甚至考虑向字节跳动购买,反映国内市场优质 GPU 资源争夺激烈且供不应求[22] - **非上市公司芯片情况**:昆仑芯推理效果优异,集群版每秒可处理 4000 多个 tokens,单机版能处理三四十个 tokens,P 系列推理优化后集群表现优于华为 910B;韩 5G 芯片带宽传输有瓶颈、耗电量大;海光少量采购组网测试,测试质量难保证[23][24] - **全球 GPU 市场格局及资本开支**:2025 年资本开支增长迅速,2026 年预计下降至 50%以下;字节跳动和阿里巴巴算力采购总量可能降至 80%左右,腾讯增加采购量,百度需求与今年持平但推理侧需求增加;若政策支持,百度将增加昆仑芯产能或进口芯片;2026 年华为生成芯片产能约 85 万,可能被国央企优先购买[25]
美股半导体:AI算力能否创新高?
2025-05-18 23:48
纪要涉及的行业或者公司 - **行业**:美股半导体行业、AI 算力行业、晶圆代工行业、AI 产业、集成电路设计领域 - **公司**:英伟达、台积电、博通、Intel、Carly、Marvell、腾讯、阿里、OPIXI、MOI、PCI、高通 纪要提到的核心观点和论据 1. **美股半导体行业 AI 算力表现及影响因素** - 表现相对较弱,财务报表数据不符合 2025 年美股 AI 叙事逻辑,收入端未加速增长 [2] - 压制算力创新高因素包括预训练见顶、Deepseek 致计算需求通缩、爆款应用商业化慢、关税影响大厂资本开支预期 [2] 2. **过去一年美股半导体行业 AI 算力变化** - 2024 年 6 月和 12 月 GPU 和 ASIC 创新高,后产量横盘半年多,2025 年 1 月开始下跌 [3] - 摩尔定律变缓,英伟达 GB200 节奏放缓影响市场预期 [3] 3. **AI 应用与 AI 算力公司走势** - 2025 年一季度到 4 月底走势一致下跌,应用跌幅大,算力公司跌幅稍少 [5] - 龙头公司如英伟达、台积电、博通等反弹强劲 [5] 4. **未来美股半导体行业与 AI 相关领域发展预测** - 受宏观变量和企业业绩双重影响,目前财务报表增速放缓,训练和推理需求未提升或压制发展 [6] - 宏观经济稳定和企业业绩改善有望推动进一步增长,龙头公司反弹超预期 [6] 5. **过去两三周 AI 算力板块股价变化影响因素** - 宏观变量:美国科技企业在中国获大量订单,提升需求预期 [7][8] - 业绩指引:大厂资本开支和下游客户强劲指引使股价稳住反弹 [8] - 中观产业因素:相关公司获潜在订单,积极影响市场预期 [8] 6. **AI 算力板块未来发展关注点** - 宏观变量:关注全球经济环境及政策对科技行业影响 [12] - 中观产业变化:关注科技巨头重要发布、季报,台积电和 Intel 先进制程进展 [9][12] 7. **市场对晶圆代工需求节奏关注点** - 关注未来两三个季度需求节奏,观察 NVIDIA 的 GP300 交付及 H20 供应受限影响 [4][13] - H20 供应受限预计损失 55 亿美元,影响 NVIDIA 今年收入 [4][13] 8. **AI 产业资本开支及其增速** - 算力需求稳定,大厂资本开支同比增速预计仍达 30%以上,但增速回落 [4][16] - 受供给端因素、对中国特供产品等影响,下半年资本开支调整未确定 [16] 9. **大模型迭代路径对算力需求影响** - 参数量和数据集变大增加算力需求,推理时间和并行计算在推理或后训练环节增加算力要求 [17] 10. **深度学习并行计算方案现状及未来发展** - 现有专家并行和通信并行方案节省通信、提高效率,但非下一代模型所需 [19] - 预计 2025 年底前后找到预训练模型迭代路径,产业界未达成共识 [19] 11. **未来 2 - 3 个季度 AI 算力需求变化预期** - 训练需求可能出现向上拐点,国内大厂关注推理需求,算法优化降低算力依赖 [20] - OPIX、MOI 和 PCI 等公司模型迭代重要,2025 年四季度前后训练新技能发展影响算力需求 [20] 12. **AI 算力公司股价走势及估值预期** - 受宏观变量、中观产业变化和微观企业业绩影响,中观产业变化更重要 [25] - 2025 年上半年估值提升压力大,下半年或改善并切换到 2026 年估值预期 [25] 13. **训练和推理算力需求及博通公司表现** - 2025 年下半年推理算力需求上升,训练算力需求不确定 [26] - 博通表现取决于训练和推理算力需求同步增长,信息明朗后股价或上涨 [26] 14. **美股 AI 算力领域未来关注变量** - 关注宏观、中观和微观企业业绩变量,未来一两个季度中观产业变化重要 [27] - 三季度难见新模型演绎路径,四季度前后或清晰 [27] 其他重要但是可能被忽略的内容 1. **台积电扩厂进展**:2025 年预计增加九个新厂,下半年 2 纳米工艺量产,3 纳米工艺满产,显示对未来 AI 算力需求乐观 [9] 2. **Intel 晶圆代工发展**:新任 CEO 推动先进制程发展,2025 年 18A 制程量产,若突破未来表现值得期待,有潜在增长空间 [11] 3. **近期重要事件**:华盛轩演讲、英伟达季报、谷歌 IO 大会、高通发布第四代骁龙产品、谷歌预计发布全新安卓系统等 [21] 4. **博通和 Marvell 季报影响**:博通股价接近前高,Marvell 因市场格局和订单问题股价低,其季报指引影响股价反弹潜力 [22] 5. **ComputeX 大会及 AI PC 发展**:去年核心是 AI PC,发展未达预期,今年关注其发展方向,未来 1 - 2 个月端侧技术或有变化 [23] 6. **中东订单对 NVIDIA 影响**:中东是全球算力分布前三区域,订单虽今年量不一定大但潜在量多,影响短期算力需求 [15]