Amazon Trainium
搜索文档
亚马逊云科技推出自研AI芯片Amazon Trainium
新浪财经· 2025-12-04 20:16
亚马逊云科技发布全新AI基础设施与芯片 - 亚马逊云科技在2025 re:Invent全球大会上宣布推出采用英伟达最新GB300 NVL72系统的P6E GB300系列,并正式发布基于自研芯片Trainium3的Trn3 UltraServers服务器 [1][2][3] - 公司持续为最苛刻的AI工作负载提供顶级算力,其全栈严谨性为全球最大企业提供最佳可靠性和性能 [1][3] - 英伟达的大规模GenAI集群Project Ceiba以及OpenAI等大型机构均在积极使用亚马逊云科技的服务 [1][3] - 大型企业客户目前使用拥有数十万颗芯片的EC2 UltraServers集群(GB200系列),并将很快升级至GB300系列 [1][3] 推出Amazon AI Factories解决方案 - 亚马逊云科技推出Amazon AI Factories,允许客户在自己的数据中心内部署专属的亚马逊云科技AI基础设施供其独享 [1][3] - AI Factory被描述为一个“亚马逊云科技私有区域”,客户可利用现有数据中心空间与电力,同时访问亚马逊云科技领先的AI基础设施与服务,包括最新训练集群、Nvidia GPU以及Amazon SageMaker和Amazon Bedrock等服务 [1][3] - 该解决方案为每个客户独立运行,保持物理与逻辑隔离,同时继承亚马逊云科技的安全性与可靠性,并能满足严格的合规与数据主权要求 [1][3] 自研AI芯片Trainium进展与规划 - 亚马逊云科技宣布其自研AI芯片Amazon Trainium 2是目前全球最佳的推理系统之一 [2][4] - Trainium 2在数据中心的部署速度比过去部署任何芯片的速度都快好几倍,是公司迄今部署速度最快的AI芯片,其销售速度几乎与产能齐平 [2][4] - 仅训练芯片业务部分,目前已是规模达数十亿美元的业务,并且仍在快速增长 [2][4] - 新一代芯片Trainium 3的UltraServers服务器现已正式可用 [2][5] - 公司已全力研发Trainium4并进入深度设计阶段,预计相比Trainium3,Trainium4将在FP4计算性能上提升6倍、内存带宽提升4倍、高带宽内存容量提升2倍,以支持全球最大规模模型的训练需求 [2][5]
科技:ASIC 受益标的;按 AI 芯片平台划分的营收敞口- Tech_ ASIC beneficiaries; revenues exposures by AI chips platform; Read across to Google's Gemini 3 announcement
2025-12-01 11:18
**行业与公司** * 报告聚焦于AI服务器供应链,特别是大中华区科技公司(GC Tech)[1][2] * 重点分析专用集成电路(ASIC)在AI推理阶段的应用趋势及其对产业链公司的影响[1] * 涉及公司众多,包括ODM厂商(如Wiwynn、Hon Hai)、零部件供应商(如AVC、Auras)、PCB/CCL厂商(如Innolight、Elite Material)、半导体公司(如TSMC、MediaTek)等[6][7][8] **核心观点与论据** * **ASIC增长趋势**:对ASIC上升趋势持积极看法,尤其在AI推理阶段[1] 预计2025E-27E AI芯片总需求分别为1000万、1400万、1700万颗,ASIC出货占比将从38%提升至45%[1][11][12] * **ASIC优势**:相比通用GPU,ASIC具有更高能效、更低预算负担和更高定制化程度,降低客户对单一供应商依赖[1] ASIC AI服务器为组件和系统供应商带来更高毛利率,因其更定制化,价值增加空间更大[15] 例如,Wiwynn(ASIC业务占比较高)自2025年起毛利率较FII(GPU业务占比较高)有2-3个百分点的优势[15][18] ASIC业务运营负担更低,库存周转更快,Wiwynn的TTM现金转换周期在3Q25为47天,低于FII的60天[16][20] * **市场驱动**:主要云服务提供商(CSPs)为自身AI模型开发内部芯片,针对搜索、推理、编码等特定用例定制[1] 全球服务器总市场规模(TAM)预计2025E-27E将分别达到3.59万亿美元、4.74万亿美元、5.63万亿美元,同比增长42%、32%、19%[13][14] AI训练服务器收入在2025E-27E预计同比增长35%、46%、20%[32] * **最新ASIC发展动态**: * 谷歌于2025年11月7日宣布Ironwood TPU(第七代)全面上市,性能较第六代Trillium TPU提升4倍,单个超级模块可互联9216颗芯片[24] * 谷歌于2025年11月18日发布Gemini 3 Pro模型,由自家TPU训练[1][24] * 亚马逊计划投资高达500亿美元为美国政府机构建设AI基础设施,将采用自研Trainium芯片和英伟达GPU[24] * OpenAI于2025年10月13日宣布与博通合作开发内部加速器,目标从2026年下半年开始部署,到2029年底完成10GW计算能力部署[24] **供应链各环节收入敞口分析** * **ODM厂商**:Wiwynn是2026E ASIC收入敞口最大的ODM厂商,得益于与亚马逊(Trainium)和Meta(MTIA)的合作[6] 其他ODM厂商如Hon Hai / FII、Quanta、Inventec和Wistron(通过Wiwynn)也有ASIC敞口,但因收入规模大,占比相对较小[6] * **冷却与机箱组件**:AVC、Auras和Chenbro对亚马逊Trainium相关业务的收入敞口在2026E达到15%-35%[6] LandMark对谷歌TPU相关需求的收入敞口估计为45-50%[6] * **PCB/CCL厂商**:Innolight和Elite Material对谷歌TPU相关需求的收入敞口在2026E分别为25-30%和15-20%[7] GCE和TUC对亚马逊Trainium的收入敞口分别为30%+和15%+,GCE对Meta MTIA ASIC的收入敞口为20%+[7] * **半导体公司**:Winway对谷歌TPU的收入敞口在2026E为15-20%[8] MPI对亚马逊Trainium的收入敞口在2026E为15-20%[8] 多数服务器厂商对AMD GPU供应链有敞口,但因终端需求较小,2026E收入敞口普遍低于10%[8] * **英伟达GPU主导地位**:英伟达GPU解决方案仍是主要收入贡献者,为Gigabyte(服务器品牌)、Quanta和FII(ODM)、AVC和Auras(冷却组件)、Innolight(光模块)、KYEC(半导体测试服务)贡献40%+的收入[8] **重点公司点评** * **Hon Hai (2317.TW)**:主要服务器ODM厂商,预计2026年GPU:ASIC收入比为80:20,是谷歌TPU服务器供应商之一[23] * **Innolight (300308.SZ)**:高速光模块关键供应商,预计800G光模块收入在2026E同比增长104%,1.6T光模块收入在2027E同比增长110%[25] * **LandMark (3081.TWO)**:提供用于高速硅光光模块的InP激光二极管和外延片,预计数通业务收入占比将从2025E的71%提升至2026E的85%[26] * **Wiwynn (6669.TW)**:AI服务器ODM厂商,1Q/2Q/3Q25营收同比增长100%+,10月营收同比增长158%[27] 正在美国建设产能以缓解地缘政治风险[27] * **台湾半导体公司**:TSMC为TPU和其他AI ASIC提供前道晶圆制造和后道先进封装服务,预计TPU占其2026E总营收<5%[29] MediaTek是谷歌TPU的设计服务供应商,预计TPU在2026E贡献约10亿美元收入(占营收5%)[29] Winway是谷歌TPU的关键测试插座供应商,预计TPU收入占2026E总营收15–20%+[29] MPI是TPU的主要探针卡供应商,预计TPU占2026E营收8–12%[29] Hon Precision是AI/HPC测试分选机主导供应商,预计TPU占2026E总营收5–10%[29][30] KYEC是TPU的主要FT测试服务提供商,预计TPU收入敞口从2025E的2%上升至2026E的5–10%[30] **其他重要内容** * **投资建议**:报告列出看多(Buy)公司包括Wiwynn、Innolight、Landmark、AVC、Auras、Chenbro、EMC、TSMC、WinWay、MPI和Hon Precision;中性(Neutral)公司包括MediaTek和KYEC[1][40]
与OpenAI签署380亿美元算力供应协议,亚马逊开盘涨超4%
第一财经· 2025-11-04 00:27
合作核心内容 - 亚马逊与OpenAI建立多年战略合作伙伴关系,OpenAI将在亚马逊AWS上运行AI工作负载,合作涉及金额达380亿美元 [3] - OpenAI将使用的服务器是Amazon EC2 UltraServers,可访问包含数十万个英伟达GPU,计算能力可扩展至数千万个CPU,AWS的集群芯片超过50万个 [4] - OpenAI将立即开始使用AWS计算服务,所有计算能力预计在2026年底前部署到位,且规模有望在2027年及之后进一步扩大 [5] 市场反应与公司业绩 - 合作消息宣布后,亚马逊股价开盘上涨超过4% [3] - 亚马逊2025年第三季度净销售额增长12%至1802亿美元,净利润为212亿美元,同比增长38.6%,AWS增长速度达到自2022年以来的最高水平 [7] OpenAI的算力合作战略 - OpenAI近期与多家算力提供商达成合作,包括英伟达将投资最多1000亿美元助力构建至少10吉瓦的AI数据中心,涉及数百万块GPU [6] - OpenAI与AMD达成多年、多代协议,将部署6吉瓦容量的AMD GPU [6] - OpenAI也在探索使用自研的ASIC芯片,并与博通合作计划开发10吉瓦的定制AI加速器,而非使用云厂商自研的ASIC芯片 [5][6] 行业趋势与高管观点 - 硅谷大模型厂商近期正在扩大与算力提供商的合作以保障自身算力使用,与Anthropic相比,OpenAI更青睐使用GPU [5] - OpenAI首席执行官表示公司当前收入远不止130亿美元,并将巨额算力支出视为前瞻性押注,公司目标成为重要的AI云服务提供方并发展消费设备业务 [7] - 行业对AI基础设施的巨额投资引发是否存在泡沫的讨论,有观点认为巨额支出是否会产生预期资本回报至少需一年后才能清楚 [7]
与OpenAI签署380亿美元算力供应协议,亚马逊开盘涨超4%
第一财经· 2025-11-03 23:49
合作核心条款 - 亚马逊与OpenAI达成多年战略合作伙伴关系,协议价值380亿美元,并将在未来7年内持续增长 [1][2] - OpenAI将在亚马逊AWS上运行AI工作负载,使用的服务器是Amazon EC2 UltraServers [2] - OpenAI将立即开始使用AWS计算服务,所有计算能力预计在2026年底前部署到位,计算能力有望在2027年及之后进一步扩大 [3] 技术基础设施细节 - 通过该合作,OpenAI将访问包含数十万个英伟达GPU的服务器,服务器计算能力还能扩展至数千万个CPU [2] - AWS的集群芯片数量超过50万个,相关部署采用复杂架构设计以提高AI处理效率 [2] - 合作未提及OpenAI将使用亚马逊自研的AI芯片(Amazon Trainium和Inferentia) [3] 市场反应与公司业绩 - 消息宣布后,亚马逊股价开盘上涨超过4%至255.1110美元,公司市值达2.73万亿美元 [1][2] - 亚马逊2025年第三季度净销售额增长12%至1802亿美元,净利润为212亿美元,同比增长38.6% [4] - AWS增长速度达到自2022年以来的最高水平,人工智能和核心基础设施需求强劲 [4] OpenAI的算力合作战略 - OpenAI近期与多家算力提供商合作以保障自身算力使用,更青睐使用GPU [3] - 合作方包括英伟达(计划投资最多1000亿美元,构建涉及数百万块GPU的AI数据中心)和AMD(部署6吉瓦容量的AMD GPU) [4] - OpenAI也在探索使用自研的ASIC芯片,并于10月与博通达成合作,计划开发10吉瓦的定制AI加速器 [4] 行业背景与高管观点 - 硅谷大模型厂商正扩大与算力提供商的合作 [3] - OpenAI CEO表示公司当前收入远不止130亿美元,巨额算力支出是前瞻性押注,公司旨在成为重要的AI云服务提供方 [4] - 市场对AI基础设施的巨额投资存在关于是否存在泡沫的激烈讨论 [5]
五大数据中心支出展望更新,2025 年第二季度同比增长 57%15%-US Communications Equipment-Updated Big Five Data Center Spend Outlook; +57%15% YY
2025-09-17 09:51
涉及的行业与公司 * 行业为美国通信设备行业 特别是数据中心基础设施和云计算领域[1] * 核心公司包括大型云服务提供商 即"五大云服务提供商" 以及Tier 2和其他云服务商[1][11] * 具体提及的公司有超大规模云服务商 谷歌 亚马逊 元 微软 甲骨文 以及专业GPU即服务提供商CoreWeave和xAI[5][7][9][11] * 硬件供应商方面提及英伟达 戴尔 超微 以及原始设计制造商[5][6][11] 核心观点与论据 **数据中心资本支出增长预测强劲** * 公司更新了对五大云服务商数据中心资本支出的预测 2025年同比增长57% 2026年同比增长15%[1] * 增长预期主要集中于人工智能相关支出 与市场包含全部资本支出的预测口径不同[1] **AI驱动因素明确且多样化** * 英伟达Blackwell Ultra平台的部署是服务器支出的主要驱动力[5] * 谷歌和亚马逊的自研定制加速器 也对支出做出贡献[5] * 网络和物理基础设施支出因AI平台预期而增加[6] * 四大云服务商同时在通用计算和AI计算上进行投资 特别是谷歌和亚马逊[7] **云服务商资本支出动态与战略** * 超大规模云服务商因宏观经济因素将需求前置 导致资本支出超预期 但这可能抑制企业支出[8] * 元公司和微软正在美国建设多个新数据中心 微软计划今年在11个新区域推出数据中心 元计划在未来2-4年进入14个区域[9] * 元公司可能因AI超级智能计划和持续扩张 其资本支出增速继续超过前四大云服务商[9] * 甲骨文计划在未来12-18个月在7个区域建设新数据中心[9] **新兴云服务商 第二梯队 增长显著** * "其他云服务商"领域的数据中心资本支出已连续四个季度增长超过23%[11] * 增长主要由采用加速计算的专业云服务商 即GPU即服务提供商 推动[11] * CoreWeave运营着32个数据中心 拥有超过25万个GPU 目标今年资本支出超过200亿美元[11] * xAI计划将其Colossus超级计算机的GPU部署从10万个增加到明年100万个[11] * 这些新兴云服务商倾向于从戴尔和超微等OEM购买商用服务器 而非ODM定制服务器[11] 其他重要内容 **供应链与库存状况** * 观察到DRAM和服务器组件库存增加 但尚未影响资本支出计划[9] * 谷歌的TPU 亚马逊的Trainium和Inferentia等高端定制加速器的部署量 今年可能超过商用高端GPU 而微软的Maia加速器遭遇延迟[9] * 通用服务器单位和前端交换机销售连续四个季度实现两位数增长[10] **宏观经济与政策影响** * 宏观经济可能推动企业向公有云迁移[10] * 折旧税收政策的变化和关税可能导致了需求前置[10] * 超大规模云服务商的需求前置是出于宏观经济因素考虑[8] **区域发展动向** * 一些GPU即服务提供商出现在中东 受益于较低的电力和土地成本 以及欧洲 以便更好地遵守地区法规[11]
连续15年霸榜Gartner魔力象限,揭秘亚马逊云科技的领导者“内核”
搜狐财经· 2025-08-22 18:18
Gartner魔力象限评级 - 亚马逊云科技连续15年被评为战略云平台服务领导者 在执行能力维度位列最高位置 [1] - Gartner通过执行能力和愿景完整性两个维度评估厂商 执行能力涵盖产品与服务、运营、客户体验与市场响应 愿景完整性考察战略方向、创新能力、行业方案和全球布局 [3] 全球基础设施优势 - 截至2025年8月在全球37个区域部署117个可用区 并计划新增4个区域和13个可用区 [5] - 多可用区和多区域架构设计提供低延迟和高可用服务 高标准SLA承诺保障关键业务运行 [5] - 中国大陆云服务可用性达99.99%以上 整体故障时长低于其他云提供商平均值的五分之一 [6] 技术创新与AI能力 - 自研第四代ARM架构Graviton处理器提供更高计算性能和能效优势 [6] - 构建生成式AI全栈能力:包括自研Trainium和Inferentia芯片 以及Bedrock、SageMaker和Q等服务 [6] - 覆盖从IaaS、PaaS到AI/ML和生成式AI的企业全生命周期服务能力 [5] 中国企业出海支持 - 通过"三横一纵"战略支持中国企业出海:三横包括全球基础设施/云服务、安全合规能力、全球资源网络 一纵指行业解决方案资产库 [7] - 2025年组建专属团队全面升级出海业务战略 涵盖产品、安全合规、合作伙伴等领域的全球支持团队 [8] - 将全球云平台优势转化为中国企业拓展国际业务和加速AI应用的实际路径 [1] 行业领导地位 - 战略云平台服务需支撑生产环境中的大规模关键工作负载 是企业业务连续性和创新能力的核心底座 [3] - 云服务商需具备弹性扩展、按需计费和自动化特征 并支撑企业数字化转型与生成式AI发展需求 [3] - 公司在技术交付、全球运营和客户支持方面保持优势 体现以客户为中心和长期创新的战略定力 [4]
Gartner报告指出云平台演进方向:全栈能力成企业创新关键支撑
环球网· 2025-08-22 15:07
战略云平台服务演进趋势 - 现代企业级云平台服务正从传统IT资源供给向覆盖IaaS、PaaS及AI/ML与生成式AI的全栈支持模式演进[1] - 战略云平台服务需涵盖IaaS、PaaS及转型服务 具备弹性扩展、按需计费和自动化特征 支撑生产环境大规模关键工作负载[3] - 企业数字化进入深水区 单一云服务难以支撑系统化创新和全球竞争需求[1] 头部厂商技术布局 - 亚马逊云科技自研第四代Graviton处理器性能提升30% 内存带宽提升75% 针对真实工作负载优化[4] - 开发专用AI训练芯片Trainium和推理芯片Inferentia 降低大规模AI应用算力门槛[4] - 通过模型服务平台Bedrock、机器学习工具SageMaker和代码助手Q提供从模型构建到部署的全流程支持[4] 行业应用与转型需求 - 生成式AI已深入业务流程自动化、用户体验重构及产品创新核心 不再是技术试验[4] - 企业越来越多依赖云平台完成AI集成与业务转型[4] - 战略云平台服务成为企业业务连续性和创新能力的关键底座 决定全球化竞争中的长期竞争力[4] 技术架构发展方向 - 优秀战略云平台需在自研技术深度优化同时保持对开源框架和异构硬件的兼容[5] - 提供"可选择、可迁移、可组合"的灵活架构 平衡高性能解决方案与技术选型自由度[5] - 服务边界从资源弹性扩展至智能系统构建、运行和迭代的全生命周期支撑[5]
亚马逊云科技:Agentic AI时代即将开启!
搜狐财经· 2025-06-20 08:59
行业趋势与AI发展 - AI技术浪潮正引发从技术架构到商业模式的颠覆性变革,企业普遍面临战略调整需求 [3] - 生成式AI快速落地推动智能体AI(Agentic AI)技术爆发,企业需在管理与技术双重维度做好准备 [3][6] - Agentic AI将成为企业变革关键引擎,贯穿提升生产力、优化运营、重塑产品及驱动商业模式创新 [6] 亚马逊云科技战略与布局 - 公司在中国市场聚焦两大核心战略:助力中国企业全球化、支持本地及跨国企业利用中国区域云服务驱动AI创新 [4] - 推出中国区域客户智能体AI实践指南,提供从架构设计到场景落地的全流程方法论 [4][11] - 构建"三横一纵"全球化服务架构,横向覆盖基础设施/安全合规/生态资源,纵向穿透行业场景 [11] 技术能力与基础设施 - 自研Graviton4处理器性能显著提升:数据库应用性能+40%,大型Java应用性能+45%,支持生成式AI推理 [8] - 过去两年超50%新增CPU容量采用Amazon Graviton芯片 [10] - 全球基础设施覆盖245个国家和地区,提供240+全栈云服务及自研AI加速芯片组(如Trainium) [10] 客户案例与商业价值 - 德勤使用Amazon Q使开发速度提升40%,测试时间降低70% [6] - 美客多通过Amazon Bedrock实现生成式广告展示次数+45%,点击率+25% [6] - 公司通过技术赋能与战略咨询结合,帮助金融/制造等领域企业将合规能力转化为竞争优势 [12] 企业实施路径建议 - 管理维度需构建认知体系、优化组织流程、升级人才结构并夯实数字化底层能力 [7] - 技术维度需聚焦安全合规、系统韧性、架构可扩展性及技术前瞻性四大基石 [7] - 打通数据壁垒实现高效治理是解锁Agentic AI价值的前提,需制定务实推进策略 [7]
晚点财经丨恒大被罚,证监会继续调查中介机构;中美运费大涨,但不是供应链危机重演
晚点LatePost· 2024-06-01 17:08
恒大被罚,证监会继续调查中介机构 - 恒大地产被证监会罚款41.75亿元,其中欺诈发行罚款41.6亿元,年报虚假记载罚款1000万元,违法信披罚款500万元 [2] - 许家印被罚款4700万元并被终身禁止进入证券市场,其中欺诈发行罚款3000万元,年报虚假记载罚款1500万元,违法信披罚款200万元 [2][3] - 其他高管也被处罚,包括时任总裁夏海钧罚款1500万元,时任CFO潘大荣罚款900万元等 [3] 中美运费大涨 - 远东到北欧和地中海航线二季度运力预计损失15%-20%,因船只绕道好望角导致航线拉长 [3] - 德鲁里世界集装箱指数本周涨至每40英尺集装箱4226美元,是去年同期的1.5倍,近三个月上涨约50% [3] - 上海至欧洲和美国集装箱运价本周上涨2%-5%,亚洲港口拥挤导致船只等待3-4天 [3][4] - 上海-鹿特丹航线运价5270美元,同比上涨242%;上海-洛杉矶航线运价5390美元,同比上涨202% [4] 英伟达客户变对手 - 亚马逊云科技自研AI芯片,训练时间从英伟达GPU的13小时缩短至5小时,推理部署所需芯片数量减半 [5] - 英伟达占据AI芯片近80%市场份额,亚马逊云科技仅1.64% [6] - 英伟达护城河来自CUDA软件生态系统,亚马逊正在搭建自己的软件平台Neuron [6] 字节重新做游戏 - 张云帆被任命为字节游戏业务第一负责人,接管沐瞳、朝夕光年和UGC部门 [6][7] - 字节游戏年收入100亿至150亿元,停止出售游戏业务 [7] - 团队调整聚焦"好玩的游戏"开发,解散数百人发行团队,保留不到50人核心团队 [7] 其他行业动态 - 中国对外证券投资规模10984亿美元,其中股权类投资6226亿美元,债券类投资4758亿美元 [9] - 5月官方制造业PMI 49.5%,较4月下降0.9个百分点,大型企业PMI 50.7%仍高于临界点 [10] - 雷诺将与中国企业合作开发售价低于2万欧元的电动车,计划两年内完成 [13] - 空客因零部件和劳动力短缺可能推迟下半年几十架飞机组装,影响全年800架交付目标 [17] - 苹果计划通过大语言模型改造Siri,新系统将能控制应用程序内所有功能,预计9月推出 [19]