Workflow
Tensor G5 chip
icon
搜索文档
全球科技-人工智能供应链 2025 年下半年生产;安卓 AI 手机;AI 工厂分析更新-Global Technology -Correction AI Supply Chain H20 Production; Android AI Phone; AI Factory Analysis Updates
2025-08-27 09:12
关键要点总结 涉及的行业和公司 **行业** * 全球科技行业 特别是人工智能(AI)半导体供应链、AI智能手机和AI数据中心(AI工厂)经济 [1][4][29][43][71] **公司** * **核心公司**:NVIDIA(英伟达)、AMD、TSMC(台积电)、Google(谷歌)、MediaTek(联发科)[2][3][4][13][19][63] * **其他提及公司**:Broadcom(博通)、Astera Labs、Samsung(三星)、Aspeed、Alchip、华为、AWS、Microsoft(微软)、Bytedance(字节跳动)、Apple(苹果)、小米 以及一系列AI半导体供应链上下游企业 [13][14][43][63][64][72] 核心观点和论据 **对NVIDIA及其供应链持乐观态度** * 在8月28日季度业绩公布前 对NVIDIA在亚洲的半导体供应链持看涨观点 [1][11] * 预计NVIDIA 10月季度营收为525亿美元 并有上行潜力 市场部分预期高达550亿美元 [2][11] * 看好NVIDIA股票 因其在未来12个月内的产量增长 尽管公司在供应和中国变量方面预计会保持保守 [12] **H20芯片生产动态与地缘政治影响** * 据CNBC报道 在中国限制采购后 NVIDIA寻求停止H20芯片生产 [2] * NVIDIA CEO重申公司已获美国政府批准恢复H20芯片销售 并明确该芯片没有安全后门 [2] * 亚洲供应链核查显示 H20的CoWoS封装现已确实停止 H20 HGX服务器组装在1-2周前停止 随后H20 GPU模块预测被削减 [2] * 一些中国客户近期对NVIDIA不带HBM(但使用GDDR7)的B40芯片表现出兴趣 预计今年需求200万单位 明年需求500万单位 [2] * 对TSMC而言 中国AI/GPU仍然是重要的长期增长动力 [2] **AI推理需求强劲增长** * AI推理需求正在增长 主要云服务提供商(CSP)处理的token数量快速增长即是证明 [14] * 截至2025年6月底 中国每日token消耗达到30万亿(月度运行速率为900万亿) 相比2024年初的每日0.1万亿增长了300倍 [14] * Google在2025年7月处理了超过980万亿token 较2025年5月的480万亿翻倍 [14] * 截至2025年5月底 字节跳动的每日token消耗达到16.4万亿(月度运行速率为508万亿) 较2025年3月底的12.7万亿增长29% [14] * 微软在2025财年(截至2025年6月)通过其Foundry API处理了超过500万亿token 同比增长超过7倍 [14] **AI工厂(数据中心)经济性分析更新** * 引入混合专家模型(MoE)到TPS计算中 这是AI推理的增长趋势 [3] * 阐明了稀疏性假设 这影响了解码时间(例如 AMD MI355采用稀疏性可比密集配置提高约5%的token输出) [3][31] * 调整了网络带宽假设 例如 AMD MI355X采用其Infinity Fabric将网络带宽比使用PCIe Gen 5(128GB/s)的MI300X提高了约20% 达到154GB/s [3][32] * 修正了对ASIC网络速度的高估 [3] * 对于token价格假设 提供了参考价格范围表 而非单一的0.2美元/百万token点 [3][37][38] * 结论:在0.3美元/百万token的价格下 大多数运行Llama 4 400B MoE的芯片都能产生利润(包括AMD旧一代芯片MI300) [3][38] * 一个100MW的AI工厂在0.2美元/百万token的假设下 估计可产生约12.8亿美元的年收入和7.22亿美元的年利润 平均利润率约52% [51] * 在0.3美元/百万token的假设下 估计可产生约19.1亿美元的年收入和13.6亿美元的年利润 平均利润率约68% [51] * NVIDIA的GB200 NVL72 pod在计算能力、内存能力和快速网络性能方面继续展示出性能主导地位 [48] **AI智能手机的新希望与Google Pixel 10发布** * Google发布了Pixel 10手机系列 其Tensor G5芯片采用TSMC的3nm工艺制造 调制解调器可能由MediaTek供应 [4][19] * Pixel 10配备了市场上所有智能手机中最好的摄像头 新的Pro Res Zoom让用户可以从高达100倍的距离捕捉细节 [19] * Gemini在手机上提供了全面且个性化的AI体验 包括Magic Cue功能、AI健康教练、实时翻译通话(使用通话者自然声音)等 [19] * 关键问题是这些功能多快能扩散到中国智能手机市场并在2026年引发换机周期 [4][9][19] **AI半导体资本支出(Capex)保持强劲** * 摩根士丹利预计2026年云资本支出将增加至5820亿美元 意味着31%的同比增长(对比市场共识仅为16%) [71] * 假设AI服务器资本支出组合(短期资产支出)增加 隐含的AI服务器资本支出在2026年可能同比增长约70% [72] * 这支撑了对美国半导体和大中华区半导体行业的“具吸引力”观点 AI需求保持强劲 [72] **供应链产能与需求预测(CoWoS & HBM)** * TSMC预计在2025年生产510万颗芯片 全年GB200 NVL72出货量预计达到3万架 [89][90] * 硬件团队估计2025年GB200/GB300服务器机架出货量在2.5-3万架左右 [91] * 全球CoWoS需求年增长率预测:2023年95% 2024e 216% 2025e 84% 2026e 48% [98] * 2025年AI计算晶圆消费收入预计高达145亿美元 [110][111] * 2025年HBM消费预计高达16e9 GB(160亿GB) 几乎是2024年水平的两倍 NVIDIA被视为最大客户 [107][108][112] * HBM TSV产能预计在2025年翻倍 [106] 其他重要内容 **投资建议与看好的公司** * 对美国半导体:增持(OW)NVIDIA、Broadcom、Astera Labs [13][63][72] * 对亚洲半导体:增持(OW)TSMC、Samsung、Aspeed、Alchip、MediaTek [13][63][72] * 替代AI半导体组:AMD、Alchip、Andes、Marvell、Broadcom [64] * AI半导体赋能组:TSMC、Synopsys、Cadence、ASML、BESI、Ibiden、KYEC、Advantest [64] **研究局限性** * 理论模型与现实场景之间存在差距 导致计算性能高于实际结果 [57] * 实际AI推理工作负载的规模各不相同 并且分布在单个或多个处理器甚至多个服务器上 使得真实环境比模型更动态 [57] * 延迟、并发性、并行性、软件栈优化和生成token质量等多种因素和性能指标难以量化 [57] * 未考虑解码过程中计算和通信的重叠时间 这也可能影响TPS结果 [57][58] * 评估和折旧人力资源成本(包括劳动力和研发费用)仍然存在挑战 [57][58] **更正声明** * 对文中关于NVIDIA HGX H200机架计算的图表10、11、13和14进行了更正 [10] * 更正了第12页“盈利能力估算”部分的两个要点 [10] * 本文最初发布于2025年8月25日 20:06 GMT 并于2025年8月26日重新发布 [10]