Google TPU

搜索文档
花旗:Dell‘Oro Q2 2025 数据中心资本支出报告要点
花旗· 2025-06-23 10:09
Flash | 17 Jun 2025 10:01:01 ET │ 9 pages – 1Q market up > 50% YoY to $134bn, driven by accelerated server spend; servers >50% of DC capex, accelerated > general purpose US Communications Equipment Dell'Oro 1Q25 Data Center Capex Report Highlights CITI'S TAKE We summarize key points from Dell'Oro Group's 1Q data center capex report. – General purpose infrastructure was up modestly – Limited impact from tariff-except components. System vendors and hyperscale cloud SPs increased component inventory purchases ...
为什么定义2000 TOPS + VLA + VLM为L3 级算力?
自动驾驶之心· 2025-06-20 22:06
规模法则在自动驾驶中的应用 - 小鹏汽车在CVPR 2025论文中验证规模法则(Scaling Laws)在自动驾驶领域持续生效,核心发现是模型性能与参数规模、数据规模、计算量之间存在幂律关系 [4] - 在10亿(1B)、30亿、70亿直至720亿(72B)参数的VLA模型上验证了"参数规模越大模型能力越强"的规律 [6] - 确立了"海量高质量数据+大模型驱动"的自动驾驶能力跃升路径,VLA模型在VLM基础上增加了决策和行动能力 [6] 自动驾驶算力需求分级 - 从L2到L3级别算力需求呈指数级增长,L2级需80-300TOPS,L3级跃升至千TOPS级别 [8] - L3级需处理复杂城市道路场景,包括多样化交通参与者、动态环境条件等,需大规模神经网络实时推理 [8] - 小鹏提出2000TOPS+VLA+VLM作为L3级自动驾驶算力新标准 [6][8] VLA+VLM架构技术细节 - VLA架构以大语言模型为骨干,集成视觉理解、链式推理和动作生成能力 [10] - 视觉处理模块需数百TOPS算力处理多传感器数据融合 [10] - 语言理解模块在复杂交通场景语义理解时消耗大量计算资源 [10] - 动作规划模块涉及路径规划、行为预测等计算密集型任务 [10] 车载算力与数据中心算力对比 - 车载算力注重实时性与功耗平衡,需在有限空间和功耗下实现高效计算 [12] - 数据中心算力用于离线训练,能力是车载系统的数十至数百倍,可处理海量历史数据 [15] - 车载芯片如NVIDIA Orin、华为昇腾追求高能效比(TOPS/Watt) [12] 行业竞争格局与技术趋势 - 华为昇腾芯片系统算力达400TOPS,蔚来ET7搭载英伟达Orin平台(254TOPS) [17] - 英伟达下一代Thor芯片采用4nm工艺,基础版1000TOPS,增强版2000TOPS [20] - 小鹏G7采用三片自研图灵AI芯片,等效9颗英伟达Orin-X芯片 [20] - ADAS芯片市场份额:英伟达36%(年出货150万片)、特斯拉28%、华为11%、Mobileye 9%、地平线8% [20]
摩根士丹利:全球科技-AI 供应链ASIC动态 -Trainium 与 TPU
摩根· 2025-06-19 17:46
报告行业投资评级 - 行业评级为In-Line,即分析师预计其行业覆盖范围在未来12 - 18个月的表现将与相关广泛市场基准保持一致 [8] 报告的核心观点 - 英伟达在GPU领域仍是美国半导体行业首选,但AI ASIC供应链存在投资机会,重申对下游系统和上游半导体部分公司的买入评级 [1][7] - 全球半导体行业市场规模2030年或达1万亿美元,AI半导体是主要增长驱动力,预计AI半导体市场规模届时达4800亿美元,云AI ASIC市场或增长至500亿美元 [21] - 大型云服务提供商有能力持续投资AI数据中心,预计2025年美国前四大超大规模企业运营现金流达5500亿美元,折旧占总费用比例上升,平均AI资本支出/息税折旧摊销前利润约为50% [58][59] 根据相关目录分别进行总结 识别AI ASIC供应链潜在机会 - 上游半导体中,台积电、爱德万测试、京元电子和日月光是关键代表;AWS Trainium 2由力成科技子公司测试,Trainium 3测试预计转至京元电子,测试解决方案由爱德万测试和泰瑞达竞争 [10] - 全球ASIC关键买入评级公司包括下游系统硬件的亚旭电子、纬颖科技、 Bizlink和金器工业,以及上游半导体的台积电、博通、阿尔卑斯、联发科、爱德万测试、京元电子、超微半导体和日月光 [11] 英伟达GPU竞争下的AI ASIC设计活动 - AWS Trainium方面,阿尔卑斯2月完成Trainium 3设计流片,5月晶圆产出,有较高机会赢得2nm Trainium 4;阿斯泰拉实验室和阿尔卑斯在连接芯片设计上合作,有助于其竞争下一代XPU ASIC项目 [3][7] - Google TPU方面,铁杉(TPU v7p)2025年上半年量产,博通可能流片另一款3nm TPU(可能是v7e),部分芯片产出在2025年底;联发科可能在8月中旬流片3nm TPU(可能是v8p),2026年下半年量产 [4][7] - Meta MTIA方面,7月或有MTIAv3初步销量预测,台湾供应链考虑为MTIAv4采用更大封装用于多个计算芯片 [5] 全球AI ASIC市场规模分析 - 全球半导体行业市场规模2030年或达1万亿美元,AI半导体是主要增长驱动力,预计AI半导体市场规模达4800亿美元,其中云AI半导体3400亿美元,边缘AI半导体1200亿美元,云AI ASIC市场或增长至500亿美元 [21] - 2025年AI服务器总可寻址市场约1990亿美元,英伟达CEO预计2028年全球云资本支出达1万亿美元,这是云AI半导体的关键潜在市场 [26] AI芯片供应指标:台积电CoWoS分配假设 - 供应链服务器机架产出逐渐改善,预计台积电2025年Blackwell芯片产出(按CoWoS - L产能计算)与AI资本支出衡量的“需求”更匹配,但在产品周期前几个季度芯片产出会超过NVL72服务器机架组装,产生芯片库存 [34] - 维持2025年台积电39万片CoWoS - L的预测,预计2026年云AI半导体同比增长31%,假设下游原始设备制造商在2026年上半年消化芯片产出,年底CoWoS估计为9万片/月 [35] 全球AI资本支出更新 - 现金流分析支持大型云服务提供商资本支出持续上升的预期,摩根士丹利预测2025年美国前四大超大规模企业运营现金流达5500亿美元,有能力持续投资AI数据中心 [58] - 预计折旧占数据中心客户总费用的比例将继续上升,2025年达到10 - 14%,2025年平均AI资本支出/息税折旧摊销前利润约为50% [59] AI GPU和ASIC租赁价格跟踪 - 英伟达4090和5090显卡零售价略有下降,但中国AI推理需求仍然强劲 [73] AI半导体 - 市盈率倍数、收入敞口、销售跟踪 - AI半导体市盈率倍数趋势显示,GP GPU(英伟达)、替代AI半导体和AI半导体推动者的市盈率倍数有所变化 [82] - AI芯片季度收入持续增加,英伟达和AMD的数据中心/高性能计算半导体收入呈上升趋势 [83][84] 关键特色报告 - 涵盖多篇关于AI供应链的报告,涉及服务器机架、订单情况、需求与供应、CoWoS预测等方面 [94][95] 关键上游AI供应链公司 - 台积电2026年晶圆价格上涨和强劲AI需求可能抵消外汇影响,评级为买入 [96] - 联发科TPU需求和进度应好于担忧,评级为买入,目标价维持在新台币1888元 [96][97] 联发科分析 - 预计联发科凭借天玑9400旗舰片上系统在高端智能手机市场获得份额,2025 - 2027年前景好于担忧,库存天数下降,表明水平健康 [110] - 考虑到联发科有很高可能性赢得2nm TPU项目,将其剩余收益模型中的中期增长率从8%提高到8.5%,目标价维持在新台币1888元 [97] - 因新台币近期大幅升值,下调2025和2026年营收预测6 - 7%,2027年营收预测下调3%,每股收益下调幅度大于营收 [100][101]
全新GPU高速互联设计,为大模型训练降本增效!北大/阶跃/曦智提出新一代高带宽域架构
量子位· 2025-05-19 12:37
大模型分布式训练技术 - 随着大模型参数规模扩大,分布式训练成为AI发展的中心技术路径[1] - 高带宽域(HBD)设计对提升大模型训练效率至关重要[2] - 张量并行和专家并行需依赖HBD提供Tbps级带宽支持[6] 现有HBD架构的局限性 - 以交换机为中心的HBD(如NVIDIA NVL-72)成本高昂且不易扩展[3][8] - 以GPU为中心的HBD(如Google TPUv3)存在严重的故障传播问题[3][12] - 交换机-GPU混合HBD(如TPUv4)在成本和容错方面仍不理想[3][18] InfiniteHBD创新架构 - 采用以光交换模组为中心的HBD架构,单位成本仅为NVL-72的31%[4] - 通过OCS技术实现节点级故障隔离,GPU浪费率接近零[4][59] - 与NVIDIA DGX相比,MFU最高提升3.37倍[4][63] 关键技术突破 - 基于硅光子技术的OCS光电转换模组(OCSTrx),支持800Gbps带宽[30][31] - 可重配置的K-Hop Ring拓扑,支持动态构建任意大小的GPU粒度环[36][39] - HBD-DCN编排算法将跨ToR流量降低5.8倍[69] 性能优势 - 互连成本仅为NVL-72的31%、TPUv4的63%[74] - 能耗为NVL-72的75%,与TPUv4持平[74] - 在Llama3.1和GPT-MoE 1.1T训练中表现优异[62][64] 行业合作 - 阶跃星辰作为通用大模型创业公司参与研发[77] - 曦智科技作为光电混合算力提供商支持技术创新[77] - 上海智能算力科技正在筹备相关集群建设[77]
腾讯研究院AI速递 20250519
腾讯研究院· 2025-05-18 22:33
生成式AI 一、 OpenAI推出AI编程Codex,可多任务并行测试至代码通过 1. OpenAI发布新版AI编程工具Codex,由codex-1模型驱动,能生成更清晰代码且自动迭代 测试至通过; 2. Codex运行于云端沙盒环境,可同时处理多项编程任务,支持与GitHub连接并预加载代码 仓库; 3. 该工具目前向ChatGPT Pro等付费用户开放,后续将实施速率限制,用户可购买额外积分 获取更多使用权限。 https://mp.weixin.qq.com/s/ATC1b5_wOXtxQsPI9r34rQ 二、 打字即出图!混元图像2.0让AI生图进入"零延迟"时代 1. 腾讯混元Image2.0实现毫秒级图像生成,用户输入提示词时即可看到实时变化,突破了传 统5-10秒生成时间的限制; 2. 新模型支持文生图和图生图两大功能,图生图模式下可选择"参考主体"或"参考轮廓",并 可调节参考强度; 3. 双画布联动功能支持实时预览和多图层融合,在复杂场景下可通过多次快速的调试达到理 想效果。 https://mp.weixin.qq.com/s/DwMvdknyqP4y9_LBERMPng 三、 Manu ...
Counterpoint:需求强劲 台积电(TSM.US)3nm制程成为其史上最快达成全面利用的技术节点
智通财经网· 2025-05-15 20:39
智通财经APP获悉,5月15日Counterpoint发文,全球晶圆代工市场的龙头企业台积电(TSM.US)在经历2022年末的库存调整后,进一步巩固了其行业的主导地 位。先进制程产能利用率保持高位,凸显了公司技术的领先优势。根据Counterpoint的数据显示,3nm制程凭借Apple A17 Pro/A18 Pro芯片、x86 PC处理器及 其他应用处理器芯片(AP SoC)的巨大需求,在量产后第五个季度就实现了产能充分利用,创下先进制程初期市场需求的新纪录。 至于未来的发展,NVIDIA Rubin GPU的引入,加上Google TPU v7、AWS Trainium 3等专用AI芯片的相继问世,在AI与高性能计算(HPC)应用需求持续攀升 的驱动下,预计未来将延续目前先进制程的高产能。 相比之下,智能手机市场已有制程(比如7/6nm和5/4nm)的初期产能增长较为缓慢。7/6nm制程虽在2020年左右凭借智能手机的需求大涨实现产能充分利用, 但随后增长放缓;而5/4nm制程在2023年年中再次增长,并在NVIDIA H100、B100、B200及GB200等AI加速芯片需求激增的推动下持续恢复。这 ...
TSMC 先进制程产能利用率持续保持强劲
Counterpoint Research· 2025-05-15 17:50
台积电市场地位与技术优势 - 台积电在2022年末库存调整后进一步巩固全球晶圆代工市场龙头地位,先进制程产能利用率保持高位[1] - 3nm制程在量产后第五个季度实现产能充分利用,创下先进制程初期市场需求新纪录,主要受Apple A17 Pro/A18 Pro芯片、x86 PC处理器及AP SoC需求驱动[1] - NVIDIA Rubin GPU、Google TPU v7、AWS Trainium 3等专用AI芯片需求推动AI与HPC应用增长,预计先进制程高产能趋势将持续[1] 不同制程产能动态 - 7/6nm制程因智能手机需求在2020年实现产能充分利用,但后续增长放缓[2] - 5/4nm制程在2023年年中恢复增长,受NVIDIA H100、B100、B200及GB200等AI加速芯片需求激增带动,产能显著提升[2] - 3nm制程成为台积电史上最快达成全面利用的技术节点,5/4nm制程在2022年Q3至2023年Q1库存调整后快速回升[4] 2nm制程发展前景 - 2nm制程预计在量产后第四个季度达成产能满载,刷新商业化纪录,受智能手机与AI应用双重需求驱动[7] - 台积电战略目标为2nm技术流片数量在头两年超越3nm和5/4nm同期水平,潜在客户包括Qualcomm、MediaTek、Intel、AMD等[7] - 台积电美国亚利桑那州工厂投资1650亿美元,未来可能承接2nm及以下制程产能的30%,增强地缘政治韧性并满足AI/HPC领域需求[9] 产能布局与战略 - 台积电美国工厂将涵盖4nm、3nm、2nm及更先进制程,核心研发仍集中在台湾[9] - 双重布局战略确保公司2030年后持续保持最先进制程高利用率,同时平衡地缘风险与客户需求[9]