涉及的行业与公司 * 行业:人工智能(AI)计算芯片与加速器行业,特别是推理成本经济学[1] * 公司:英伟达(Nvidia, NVDA)、博通(Broadcom, AVGO)、超微半导体(AMD)、亚马逊(Amazon)的Trainium芯片、谷歌(Google)的TPU芯片、迈威尔科技(Marvell)[1][2][5][12][35] 核心观点与论据 * 推理成本曲线分析显示TPU正快速追赶英伟达 * 谷歌/博通的TPU在计算成本性能上正迅速缩小与英伟达GPU解决方案的差距[2][13] * 从TPU v6到TPU v7,每token成本降低了约70%,在绝对成本上与英伟达的GB200 NVL72相当或略优[2][15] * 这与谷歌内部工作负载(包括训练Gemini模型)增加TPU使用,以及Anthropic等具有强大软件能力的客户增加使用趋势一致,Anthropic已向博通下达价值210亿美元的订单[15] * 英伟达仍保持关键竞争优势 * 英伟达在“上市时间”上保持领先,其年度产品发布节奏最快[2][16] * CUDA软件及其丰富的开发者生态系统是其对企业客户的关键护城河[2][12][25] * 英伟达在研发上投入远超竞争对手,预计2026/27年运营支出将超过竞争对手总和,并持续高速增长[18][19][21] * 英伟达凭借在数据中心全栈(硬件加软件)的创新,预计将在中期保持加速器市场的领先地位[12][16][27] * AMD和亚马逊Trainium目前落后,但未来或有改善 * 根据分析,AMD和亚马逊解决方案的代际成本降低约为30%,在绝对推理成本上落后于英伟达和谷歌TPU[2][16] * 预计AMD基于MI455X的Helios机架解决方案在2026年下半年推出后,推理成本可能大幅下降约70%,更具成本竞争力[16][38] * 自AWS re:Invent后,渠道检查表明Trainium 3&4可能提供更强性能以纠正Trainium 2的一些挑战[2][16] * 网络、内存和封装技术成为新的成本降低关键驱动力 * 由于计算芯片已接近光罩尺寸极限,进一步的性能和成本改进将越来越依赖于网络、内存和先进封装等相邻技术的创新[3][12][16] * 具体创新包括:引入纵向和横向扩展以太网以增加系统带宽;持续集成高带宽内存和NAND闪存解决方案;台积电最新的CoWoS封装技术;机架级解决方案的密集化;共封装光学器件的引入[16] * 英伟达(通过Mellanox业务)和博通(凭借其行业领先的以太网网络和SERDES能力)被视为最能利用这些领域发展的公司[5][12] * 英伟达股票估值面临结构性压力 * 英伟达股票在过去两年相对于AI芯片设计同行中值有约25%的折价,而五年回顾期则有20%的溢价[22][23] * 其估值折价压力源于:ASIC(尤其是TPU)已实现显著成本降低并与英伟达方案趋同;英伟达毛利率仍远高于竞争对手;超大规模企业资本支出高企但核心大语言模型盈利能力仍不明朗[22] * 英伟达股票要缩小折价或再次获得溢价,可能需要看到以下因素的结合:基于Blackwell训练的模型显示出有吸引力的性能提升;每token成本显著低于竞争方案;AI在企业用例中的货币化[22] * 长期GPU与ASIC之争的四种潜在情景 * 情景一:企业和消费者AI应用有限。若AI大规模应用仅限于少数用例,行业资本支出可能放缓,这将更有利于ASIC的采用[25] * 情景二:消费者AI持续扩展,但企业AI应用有限。工作负载可能变得更静态并集中于超大规模企业用例,这将驱动更多ASIC采用[25] * 情景三:消费者AI持续扩展,企业AI获得适度发展。英伟达将继续主导训练市场,并从企业客户中获得更多增量收入机会[25] * 情景四:消费者和企业AI在越来越多的用例中强劲扩展。这是对英伟达最有利的情景,因其在训练市场的主导地位将得到巩固,但其“上市时间”和CUDA护城河将进一步加强,ASIC也将受益但市场份额增长可能较慢[26] 其他重要内容 * 分析方法的说明与局限 * 分析基于当前计算性能的瞬时快照,未完全考虑软件优化或网络、内存和封装进步带来的性能提升[4] * 方法论侧重于加速器计算性能,未完全考虑新网络、内存或封装的性能提升[4] * 关键假设包括:1GW AI数据中心资本支出约550亿美元,其中英伟达份额约300亿美元;GB200 NVL72整机架ASP为300万美元;机架利用率为70%;基于20万亿活跃参数模型进行推理;硬件折旧期4年;电力成本每千瓦时0.1368美元[39][40] * 对各公司的具体投资观点与目标 * 英伟达(买入,目标价250美元):预计其中期保持领先,近期因超大规模企业和非传统客户需求强劲,基本面有上行潜力,股价较同行折价且NTM每股收益预期比Visible Alpha共识高18%,风险回报偏正面[27][28] * 博通(买入,关注名单):被视为TPU使用增加趋势及行业领先以太网网络能力的主要受益者,市场低估了其AI网络业务的上升空间,预计未来几个季度Street预期将向上修正,将FY26每股收益预期上调至10.87美元,较Visible Alpha共识高6%[29][31][32] * AMD(中性,目标价210美元):当前估计和股价已反映了OpenAI的按时部署,风险回报相对平衡,若看到OpenAI部署在2026年下半年推动基本面或赢得新超大规模企业客户,观点可转向更积极[33][34] * 迈威尔科技(中性,目标价90美元):基于分析,亚马逊Trainium平台成本降幅较小,且对2027年新定制XPU及其附加项目爬坡形态的可见度有限,若看到Trainium 3/4项目有显著改进证据,观点可转向更积极[35][36]
美洲科技 - AI 单位经济效益:GPU 与 ASIC 及推理成本曲线 - 买入 AVGO 与 NVDA-Americas Technology_ AI Unit Economics_ GPUs vs. ASICs and the inference cost curve - Buy AVGO and NVDA