Workflow
AMD MI450X
icon
搜索文档
32张图片图解SemiAnalysis的亚马逊AI芯片Trainium3的深度解读
傅里叶的猫· 2025-12-07 21:13
AWS Trainium3核心理念与战略 - 核心理念是最大化性价比与运营灵活性,追求最佳总拥有成本,而非固定硬件标准 [3][4][8][9] - 采用“Amazon Basics”方法设计系统与网络,根据特定客户和数据中心需求选择交换机带宽和冷却方式,以实现最佳TCO [4][9] - 软件战略从内部优化转向开源生态,旨在构建类似CUDA的护城河,通过开源PyTorch后端、NKI编译器、XLA图编译器及内核库来扩大采用率 [5][6][10] 市场竞争格局与AWS定位 - 人工智能加速器市场竞争激烈,NVIDIA是当前领导者,但面临AWS、AMD、Google等多条战线挑战 [7][10] - AWS Trainium3凭借极强的性价比成为新的竞争者,其上市策略包括对OpenAI等客户提供股权回扣以加速采用 [7][10] - 行业需加速发展以保持领先,避免自满 [7][10] Trainium3硬件规格与代际升级 - 相比Trainium2,Trainium3在关键规格上实现显著提升:BF16/FP8 FLOPs提升2倍,支持MXFP8数据格式,HBM3E容量从96GB增至144GB(+50%),引脚速度从5.7Gbps提升至9.6Gbps(+70%),纵向扩展带宽从PCIe Gen5升级至Gen6实现2倍提升 [12] - 存在4种服务器SKU,品牌命名与供应链代号不一致易导致混淆,文章呼吁AWS采用更清晰的命名法 [12] - 预计下一代Trainium4将采用HBM4,内存带宽和容量相比Trainium3再次翻倍 [12] 机架架构演进与设计 - 架构从Trainium2的2D/3D Torus拓扑演进至Trainium3的交换式纵向扩展架构,后者为前沿MoE模型提供更好的绝对性能和性价比 [4][9][14][26] - Trainium3提供两种主要交换式机架SKU:风冷的NL32x2(代号Teton3 PDS)和液冷的NL72x2(代号Teton3 MAX),分别针对不同功率密度和规模需求 [7][10][26][30] - 设计注重可维护性与可靠性,采用无电缆设计、支持热插拔,不同于NVIDIA追求极致性能而有所牺牲的理念 [28][29][44] 硅工艺与封装技术 - Trainium3采用台积电N3P工艺节点,这是专为高性能计算优化的3nm工艺,相比N5在速度、功耗和密度上带来增量收益 [15] - 封装采用双CoWoS-R组件结构,使用有机薄膜中介层,相比硅中介层成本更低、机械柔性更好,并通过集成无源器件弥补细微布线和电源完整性不足 [16][17][18] - N3P工艺面临漏电与良率挑战,可能导致产品时间表推迟 [15] 供应链与设计合作伙伴策略 - Trainium3的设计从Marvell转向Alchip,后者负责绝大多数产量,主要原因是Marvell在Trainium2上执行不力、开发周期过长 [20] - AWS采用双流片策略,极度关注成本,压缩了合作伙伴的利润空间 [20] - 与Astera Labs建立合作伙伴关系,通过批量采购和股权认股权证获得约23%的有效折扣 [41] 网络架构与扩展能力 - 纵向扩展网络从第一代160通道PCIe交换机演进,未来将采用320通道PCIe及72+端口的UALink交换机,以降低延迟、优化MoE性能 [4][9][37][41] - 横向扩展网络基于弹性织物适配器架构,提供高安全性、可扩展性和低延迟,默认配置为每芯片200Gbps EFA带宽,并可升级至400Gbps [29][35][45] - 采用高基数网络策略,通过定制交换机(12.8T/25.6T/51.2T)和逻辑端口配置,最大化GPU连接规模,实现大规模网络 [46][47] 性能优化与创新特性 - 配备专用集体通信核心,实现计算与通信任务的无竞争并发处理,简化高性能实现 [49][50] - 具备低延迟集体通信特性,如近内存计算、SBUF直接传输、自动转发和零成本转置,优化LLM训练和MoE模型性能 [51][52] - 支持高级流量管理与动态MoE,通过硬件流量整形和原生动态路由支持,无需预先数据洗牌 [53][54] 商业化与部署策略 - 通过无电缆设计、使用Retimer、背板冗余通道等设计哲学,以及风冷/液冷双选项,提高组装效率、部署灵活性和可维护性 [44] - 供应链优化旨在缩短从CoWoS封装到完整机架的交付时间,目标在季度内完成,以实现比竞争对手更快的客户收入生成 [44] - 交换式拓扑相比Torus更受青睐,AWS策略是兼容多代交换机,追求TCO与上市时间的平衡 [26][35]