Workflow
MI325X
icon
搜索文档
低谷翻倍,AMD又行了?
格隆汇· 2025-08-10 20:37
核心观点 - AMD在AI芯片领域与英伟达竞争,但市场份额和性能仍落后[1][6][9] - MI300系列推动数据中心业务增长,但出货量受供应链限制[3][6] - MI350系列发布后股价反弹,但软件生态和产能仍是短板[12][17][27] - 公司服务器CPU市场份额从2%提升至36.5%,"CPU+GPU"组合助力增长[12] - 美国政府放宽出口限制,AMD计划在中国销售MI308芯片[15] 产品与技术 - MI300系列内存是英伟达H100的2.4倍,带宽是1.6倍,但出货量低于预期[3][6] - MI325X性能落后于英伟达B200,销量不佳[7][8][9] - MI350采用台积电3nm工艺,晶体管1850亿,算力达20PFLOPS(MI300X的4倍)[17] - MI355X推理吞吐量比B200高20-30%,训练性能与B200/GB200相当[26] - MI400系列将集成72颗芯片的Helios机架系统,目标英伟达DGX生态[19] 市场表现与竞争 - 2023年四季度至2024年一季度股价上涨75%,2024年4月至今涨幅超100%[3][12] - 英伟达占据台积电60%的CoWos产能,AMD供应链受限[6] - 英伟达B200性能全面领先MI325X,且提前一个季度出货[8][9] - AMD数据中心收入同比增长14%,英伟达增长154%[24] - AMD毛利率40%(调整后54%),英伟达达75%[15][24] 客户与生态 - OpenAI承诺使用AMD GPU,甲骨文和IBM关注性价比[17][27] - 英伟达CUDA覆盖90%开发者,AMD ROCm7优化不足[27] - 英伟达中短期租赁服务供应商超100家,AMD供应稀缺[27] - 英伟达Blackwell产能已被预定至2024年底[28] 行业趋势 - 美国科技公司2024年AI基础设施支出预计达4000亿美元[19] - 算力需求远超预期,下游探索高性价比方案[17][20] - AMD将AI芯片发布周期从两年缩短至一年,但仍慢于英伟达[24]
低谷翻倍,AMD又行了?
格隆汇APP· 2025-08-10 16:41
核心观点 - AMD作为英伟达的主要竞争对手,市场对其AI芯片业务寄予厚望,但实际表现与预期存在差距 [2][3][4] - 公司股价经历大幅波动,近三个月复苏并创下新高,主要受MI350系列发布、出口限制放宽及服务器市场份额提升推动 [5][21][22][25] - AMD在AI芯片市场的竞争力受限于供应链能力、产品迭代速度及软件生态,难以撼动英伟达主导地位 [16][18][44] - 公司通过提升产品迭代速度、优化性价比策略及拓展客户群,试图在快速增长的市场中分得更大份额 [40][42][49] 产品与技术 - MI300系列内存是英伟达H100的2.4倍,带宽是1.6倍,性价比出色但出货量受供应链限制 [10][11][15][16] - MI325X因迭代速度落后,性能不及英伟达B200,销量不佳 [17][18] - MI350系列采用台积电3nm工艺,集成1850亿晶体管,算力达20PFLOPS,是MI300X的4倍 [28][40] - MI355X推理吞吐量比B200高20-30%,训练性能与B200相当,性价比优势吸引甲骨文等客户 [42] - MI400系列将集成72颗芯片的Helios机架系统,目标直指英伟达DGX SuperPod生态 [32] 市场表现与竞争 - 2023年四季度至2024年一季度股价上涨75%,但随后因销量预期弱于市场信心动摇 [12][15] - 2024年4月至今股价涨幅超一倍,从76.48美元低点反弹至170美元以上 [21] - 数据中心业务同比增长14%,远低于英伟达的154% [40] - 服务器市场份额从2%逆袭至36.5%,"CPU+GPU"组合推动份额稳中有升 [22] - 英伟达占据台积电60%的CoWoS封装产能,AMD供应链受限 [16] 客户与需求 - OpenAI CEO承诺使用AMD最新GPU [29] - 美国科技公司今年AI基础设施资本支出预计达4000亿美元,远超欧盟国防开支 [32] - 大型云服务商和AI大模型玩家需求远超预期,英伟达产能无法完全满足 [31] - 中短期租赁市场英伟达性价比更优,因供应充足且生态成熟 [43][44] 挑战与短板 - 软件生态落后,ROCm 7优化深度和社区支持不足,易用性差 [44] - 产品迭代速度比英伟达慢一代,发布节奏从"两年一更"提速至"一年一更"仍显不足 [40] - 市场份额短期难以与英伟达抗衡,定位为市场的"多一种选择" [48][49] - 二季度库存减记导致毛利率降至40%,不计减记为54%,仍低于英伟达的75% [26][40]
Buy AMD Stock for New Peaks as Q2 Earnings Approach?
ZACKS· 2025-08-05 04:45
公司业绩与市场表现 - AMD将于8月5日盘后发布第二季度财报 市场关注其能否延续近期股价强势表现 该股近期触及52周高点182美元 年内涨幅达45% 远超标普500(6%)和纳斯达克(8%) 甚至超过英伟达(32%)的同期表现 [1][4] - 第二季度营收预计同比增长27%至74 1亿美元(去年同期58 4亿美元) 但每股收益可能从0 69美元降至0 47美元 主要受CPU/GPU市场竞争定价及下一代GPU研发投入增加影响 [5][6] - 公司已连续25个季度达到或超越Zacks每股收益预期 最近四个季度平均超出预期2 3% 2025及2026财年仍有望保持双位数收入与利润增长 [6][8] AI与数据中心业务 - MI355X GPU计算性能达前代MI325X的7倍以上 获得甲骨文 特斯拉和OpenAI等巨头采用 正成为英伟达产品的有力竞争者 [2] - AI加速器需求强劲推动MI350系列芯片涨价至2万美元以上 第一季度数据中心收入因此激增57% [3] - 美国政策放宽使公司恢复对华芯片出口 可能带来数亿美元新增收入 [4] 估值比较 - 公司远期市盈率44倍 高于标普500(23 3倍) 但与博通(44倍)相当 接近英伟达(40 7倍) [10] - 远期市销率8 7倍显著低于英伟达和博通(均超20倍) 在AI芯片厂商中估值更具合理性 [11] 市场预期 - 华尔街重点关注第三季度业绩指引 以判断增长持续性 尽管近期股价三个月暴涨70% 但新财报可能推动股价再创新高 [4][13]
SemiAnalysis--为什么除了CSP,几乎没人用AMD的GPU?
傅里叶的猫· 2025-05-23 23:46
测试背景与目标 - 研究团队耗时6个月对比AMD与NVIDIA的AI服务器推理性能,验证AMD在总体拥有成本(TCO)下是否优于NVIDIA [2] - 结果显示不同任务类型(聊天、文档处理、推理)下两者性能差异显著:超大规模企业直接运营GPU时,NVIDIA在部分工作负载的perf/$更优,而AMD在另一些场景表现更佳 [2] - 中短期(不足6个月)租赁市场因AMD服务供应商稀缺导致价格高企,NVIDIA凭借超100家Neocloud提供商形成竞争市场,租赁成本优势显著 [2] 硬件性能对比 - MI325X(2025Q2出货)作为H200竞品面临时间劣势,比HGX B200晚一季度出货导致供应商偏好NVIDIA [5] - B200(2025Q1末出货)当前软件未完善,如FP8格式DeepSeek V3在TRT-LLM/vLLM/SGLang上运行不全 [5] - MI355X(2025Q3出货)比B200晚两季度,H200/H100在内存带宽(最高4.8TByte/s)和节点容量(1.152GByte)上弱于MI325X(6TByte/s, 2.048GByte) [6] 基准测试方法 - 采用在线吞吐量与端到端延迟结合的测试方法,模拟真实推理场景 [10] - 模型选择覆盖密集架构(Llama3 70B/405B)和稀疏MoE架构(DeepSeekV3 670B),输入输出组合涵盖4K/1K(摘要)、1K/1K(翻译)、1K/4K(推理)三类典型场景 [10][11] - 推理引擎选择vLLM(Llama3)、TRT-LLM(H200)、SGLang(DeepSeek),系统评估所有可行张量并行配置 [12][13] 关键测试结果 Llama3 70B FP16 - 1K/1K场景:低延迟时H100/H200+vLLM领先,高并发下MI325X反超 [15] - 1K/4K场景:H100性能稳定在900 tokens/GPU/s,MI325X在450秒延迟时吞吐量最高 [16] - 4K/1K场景:H200+TRT-LLM从20秒延迟起持续领先,MI325X的TP=1配置高并发表现突出 [16] Llama3 405B FP8 - 1K/1K场景:MI325X持续优于H200+vLLM,H200+TRT-LLM单GPU达1000 tokens/s [17] - 4K/1K场景:MI325X全延迟范围碾压竞品,MI300X在250秒延迟时超越H200+vLLM [19] DeepSeekV3 670B FP8 - 1K/1K场景:H200全延迟级别击败MI300X,MI325X仅在25-35秒延迟区间有竞争力 [20] - 4K/1K场景:H200低延迟优势明显,MI325X在>100秒延迟时性能比H200高20% [25] 总拥有成本(TCO)分析 - AMD硬件成本优势显著:MI300X单位每小时总成本1.34美元(资本占比70.5%),低于H200的1.63美元(资本占比76.4%) [21] - Llama3 405B场景:MI325X服务成本持续低于H200+vLLM,但H200+TRT-LLM在>60秒延迟后凭借性能优势逆转 [24] - DeepSeekV3场景:MI325X在摘要任务中每美元性能比H200高20-30%,但低延迟场景仍属NVIDIA [25] 市场采用率差异原因 - 租赁市场结构失衡:NVIDIA有超100家Neocloud供应商竞争,AMD仅少数导致租金溢价 [26] - 价格敏感度测算:MI300X需降至1.9美元/小时(1K/1K场景)或2.1-2.4美元/小时(1K/4K场景)才具竞争力,当前实际租金超2.5美元/小时 [30] - 软件生态差距:AMD研发集群投入仅1300万美元(上季度),远低于7.49亿美元股票回购,ROCm的CI覆盖率不足CUDA的10% [5][12] Blackwell(B200)初步表现 - 在Llama3 70B/405B的1K/4K测试中,B200-TRT全延迟范围碾压MI325X/MI300X,最高请求率下未现性能瓶颈 [28] - 当前软件支持局限:主流框架(vLLM/SGLang)对B200稳定支持不足,TRT-LLM优化仅覆盖少数模型 [27]
财报点评| AMD:营收、指引均超预期,CPU端全力追赶,GPU端仍未得青眼
贝塔投资智库· 2025-05-08 11:55
财务表现 - Q1收入74.4亿美元,同比增长36%,优于分析师预期的71.2亿美元 [2] - 毛利37.4亿美元,同比增46%,环比跌4%,毛利率50%,环比跌一个百分点 [2] - 营业利润率达11%,利润7.1亿美元,调整后EPS为0.96美元,好于预期的0.94美元 [2] 分业务部门表现 - 数据中心部门收入37亿美元,同比增57%,主要得益于EPYC CPU和Instinct GPU销售额增长 [5] - 客户端和游戏部门收入29亿美元,同比增28%,其中客户端收入23亿美元,同比增68%,游戏收入6.47亿美元,同比降30% [5] - 嵌入式部门收入8.23亿美元,同比降3%,终端市场需求喜忧参半 [6] 关税影响与指引 - 4月起AMD中国特供MI308需许可证出售,预计Q2销售额减少7亿美元,年度营收影响15亿美元 [7] - Q2收入指引约74±3亿美元,好于预期的72.3亿美元,非GAAP毛利率预计43%(Q1为54%) [7] - 公司预计关税影响集中在Q2和Q3,但下半年新品有望推动销售增长,实现2025年两位数收入增长 [7] CPU市场竞争 - CPU市场占有率从38.7%提升至40.1%,所有细分领域均实现份额增长 [8] - 台式机端市占50.3%,笔电端从22.9%提升至28.2%,服务器端从16.2%跃升至31.6% [10] - 英伟达计划发布Arm消费级CPU,x86领域AMD已超越英特尔 [10] GPU与云业务 - 北美四大云厂商25Q1总资本支出773亿美元,同比增长62%,但AMD未显著提升云业务份额 [11][12] - MI325X已量产,MI350提前至25年中生产,MI400将于26年推出 [12] - AMD取消三星4nm订单,转向台积电美国晶圆厂 [12] 目标价调整 - 汇丰目标价从70美元上调至75美元,瑞穗从120美元下调至117美元 [13] - 杰富瑞从120美元下调至100美元,摩根大通从130美元下调至120美元 [13]