关键要点总结 涉及的行业和公司 行业 * AI半导体供应链 * AI智能手机 * AI数据中心/算力工厂 * CoWoS先进封装 * HBM存储器 公司 * 核心公司:NVIDIA、AMD、TSMC、Google、MediaTek * 其他提及公司:Broadcom、Astera Labs、Samsung、Aspeed、Alchip、AWS、Microsoft、Meta、Tesla、华为、苹果、小米、百度、腾讯、阿里巴巴、字节跳动等[1][2][4][10][60] 核心观点和论据 对NVIDIA供应链的乐观看法 * 在8月28日季度业绩公布前,对NVIDIA在亚洲的半导体供应链持乐观态度[1][8] * 10月季度收入预览为525亿美元,并认为存在上行空间,部分卖方预测高达550亿美元[8] * 对股票的看好基于未来12个月的需求增长,但公司在供应和中国变量方面预计将保持保守[9] NVIDIA H20芯片动态 * 据CNBC报道,在中国限制采购后,NVIDIA寻求停止H20芯片生产[2] * NVIDIA CEO重申公司已获得美国政府批准恢复H20销售,并明确该芯片没有安全后门[2] * 亚洲供应链检查证实H20的CoWoS封装现已停止,H20 HGX服务器组装在1-2周前停止,H20 GPU模块预测近期被削减[2] * 部分中国客户对NVIDIA不带HBM但使用GDDR7的B40芯片表现出兴趣,预测今年需求200万颗,明年需求500万颗[2] AI推理需求强劲增长 * 主要云服务提供商处理的月度Token数量表明AI推理需求正在增长[11] * 截至2025年6月底,中国的Token消耗量达到每日30万亿(月度运行率为900万亿),较2024年初的每日0.1万亿增长300倍[11] * Google在2025年7月处理超过980万亿Token,较2025年5月的480万亿翻倍[11] * 截至2025年5月底,字节跳动的Token消耗量达到每日16.4万亿(月度运行率为508万亿),较2025年3月底的每日12.7万亿增长29%[11] * Microsoft在2025财年通过其Foundry API处理了超过500万亿Token,同比增长超过7倍[11] AI工厂经济性分析更新 * 引入了MoE(混合专家)架构到TPS(每秒Token数)计算中,以反映AI推理的增长趋势[3][26] * 澄清了稀疏性假设,这会影响解码时间(例如,AMD MI355采用稀疏性可比密集配置提高约5%的Token输出)[3][28] * 调整了网络带宽假设(例如,AMD MI355X采用其Infinity Fabric将网络带宽提高约20%至154GB/s,而MI300X使用PCIe Gen 5为128GB/s)[3][29] * 修正了对ASIC网络速度的高估[3] * 提供了Token价格的参考范围表,而非单一的0.2美元/百万Token价格点[3][35] * 结论:在0.3美元/百万Token的价格下,大多数运行Llama 4 400B with MoE的芯片都能产生利润(包括AMD旧一代芯片MI300)[3][35] AI智能手机的新希望:Google Pixel 10 * Google发布了Pixel 10手机系列,拥有市场上所有智能手机中最好的摄像头,支持高达100倍变焦的Pro Res Zoom[16] * Gemini在手机上提供全面个性化的AI体验,包括Magic Cue功能(可预测问题)、AI健康教练、实时翻译通话(使用通话者自然声音)[15][16] * Tensor G5芯片采用TSMC的3nm工艺制造,调制解调器可能由MediaTek供应[4][16] * 关键问题在于这些功能多快能普及到中国智能手机市场并引发2026年的换机周期[4][16] 财务预测与估值 * AI工厂盈利性:在0.2美元/百万Token假设下,100MW AI工厂年收入约11.6亿美元,年利润约6.08亿美元,平均利润率约47%;在0.3美元/百万Token假设下,年收入约17.4亿美元,年利润约11.9亿美元,平均利润率约65%[48] * TSMC AI收入:AI预计占TSMC 2024年总收入的mid-teens份额,占2025e总收入的25%[65] * 云资本支出:摩根士丹利预计2026年云资本支出将增至5820亿美元, implying 31% 同比增长(vs. 共识预期仅+16%),AI服务器资本支出可能在2026年同比增长约70%[68][69] * CoWoS需求:2025e全球CoWoS需求预计为68万片晶圆,同比增长84%;2026e预计为100.4万片晶圆,同比增长48%[94][95] * HBM需求:2025e HBM需求预计接近200万GB,几乎是2024年水平的两倍[104][105] * AI计算晶圆消费:2025e AI计算晶圆消费收入预计高达145亿美元[107][108] 其他重要内容 投资建议与看好的公司 * 美国半导体:超配NVIDIA、Broadcom、Astera Labs[10][60] * 亚洲半导体:超配TSMC、Samsung、Aspeed、Alchip、MediaTek[10][60] * 替代AI半导体组:AMD、Alchip、Andes、Marvell、Broadcom[61] * AI半导体赋能组:TSMC、Synopsys、Cadence、ASML、BESI、Ibiden、KYEC、Advantest[61] CoWoS产能与分配 * TSMC CoWoS产能:2025e年底预计达到93k wpm(千片晶圆/月),2026e年底预计达到120k wpm[84][85][91] * 非TSMC CoWoS产能:2025e年底预计达到13k wpm,2026e年底预计达到15k wpm[84][85][91] * 2026年CoWoS关键客户分配:NVIDIA (59%), Broadcom (15%), AMD (10%), AWS+Alchip (5%), Marvell (5%)[94][97] 风险与局限 * 中国监管风险:中国政府可能阻止中国客户购买美国芯片,对NVIDIA在中国的机会评估是指导中的一大变量[9] * AI工厂研究局限:理论与现实场景存在差距;实际推理工作负载更具动态性;延迟、并发、并行性、软件栈优化等因素难以量化;未考虑解码过程中计算和通信的重叠时间;评估和折旧人力资源成本仍存在挑战[55] * 定价模式差异:LLM可以创造竞争壁垒,可能实现更高定价和收入;计算未包含开发此类LLM的研发支出;许多数据中心仅作为AI硬件出租方运营,这可能显著降低整体收入和利润率[46]
全球科技-人工智能供应链 2025 年下半年生产情况;安卓人工智能手机;人工智能工厂分析更新-Global Technology -AI Supply Chain H20 Production; Android AI Phone; AI Factory Analysis Updates
2025-08-26 09:19