Google TPU

搜索文档
amd+openai
小熊跑的快· 2025-10-06 21:16
如果amd能抢到产能的话! openai也有钱支付的话、确实弹性大的离奇!比原来分析师 AMD 和openai签订协议, 该协议涵盖从 2026 年下半年开始的几年内部署数十万个 AMD 人工智能芯片 或图形处理单元 (GPU),相当于 6 吉瓦。 OpenAI 将从明年开始基于其即将推出的 MI450 系列芯片 建造一座 1 吉瓦的设施,届时将开始确认收入。 目前AMD MI450 公布的单卡2000W(MI355 1400w),如果按照MI450X单卡功耗2000W来计算,6GW 相当于 300万颗 的产能,超过了google 今年220w颗tpu的量!接近 3/4 英伟达 目前一年出货量。 今年amd 一年出货量 也就预测不到50w颗,毕竟最乐观的卖方也给的这块100亿美金的预估(40万颗的 量)!26年台积电抢产能破头 到8月底也就抢了不到70w颗!明年1GW的量,保守预计50w颗 供给 openai!2.5w一颗,也有明年125亿美金新增收入。 们测算的150亿美金收入,翻了接近一倍! openai是大手笔,之前在甲骨文的1000亿订单,按照nv b200 卡换算,大概也对应240w颗的量。 goo ...
Why Is Broadcom Stock Surging Thursday?
Yahoo Finance· 2025-10-03 02:33
Broadcom (NASDAQ:AVGO) capitalized on Wall Street’s artificial intelligence boom Thursday, fueled by billions in chip investments from Microsoft (NASDAQ:MSFT), Meta Platforms (NASDAQ:META), and other technology giants. Broadcom has emerged as one of the biggest beneficiaries of the generative AI boom, carving out a strategic niche in the rapidly evolving chip market. While competitors like Nvidia (NASDAQ:NVDA) offer off-the-shelf, high-performance GPUs, Broadcom focuses on designing custom AI chips for ...
关于投资OpenAI、AI泡沫、ASIC的竞争……刚刚,黄仁勋回答了这一切
搜狐财经· 2025-09-27 14:55
他预计,如果未来AI为全球GDP带来10万亿美元的增值, 那么背后的AI工厂每年的资本支出需要达到5 万亿美元级别。 谈及和OpenAI的合作,黄仁勋表示, OpenAI很可能会成为下一个万亿美元级别的超大规模公司,唯一 的遗憾是没有早点多投资一些,"应该把所有钱都给他们"。 在AI商业化前景方面,黄仁勋预计, 未来5年内,AI驱动的收入将从1000亿美元增至万亿美元级别。 关于ASIC的竞争,英伟达放话, 即使竞争对手将芯片价格定为零,客户仍然会选择英伟达,因为他们 的系统运营成本更低。 以下为对谈的亮点内容: 近日,英伟达创始人兼CEO黄仁勋做客「Bg2 Pod」双周对话节目,与主持人Brad Gerstne和Clark Tang 进行了一场广泛的对话。 对谈中,黄仁勋谈及了和OpenAI价值1000亿美元的合作,并就AI竞赛格局、主权AI前景等主题发表了 自己的看法。 黄仁勋表示,现在的AI竞争比以往任何时候都激烈, 市场已从简单的"GPU"演变为复杂的、持续进化 的"AI工厂",需要处理多样化的工作负载和呈指数级增长的推理任务。 这必须通过他们的资本、通过股权融资和能够筹集的债务来资助。 未来5年内, ...
关于投资OpenAI、AI泡沫、ASIC的竞争...刚刚,黄仁勋回答了这一切
华尔街见闻· 2025-09-27 11:56
AI行业前景与市场规模 - AI预计将为全球GDP带来10万亿美元的增值 背后AI工厂年资本支出需达5万亿美元级别 [2] - 未来5年内 AI驱动收入将从1000亿美元增至万亿美元级别 且该增长概率几乎确定 [4][6] - AI占全球GDP比例预计达55-65% 约50万亿美元 其中10万亿美元需通过AI基础设施增强 [13][35][36] 英伟达与OpenAI合作 - 英伟达与OpenAI建立价值1000亿美元的合作关系 涉及芯片、软件、系统及AI工厂层面直接合作 [6][19][24] - OpenAI很可能成为下一个万亿美元级别超大规模公司 英伟达对其早期投资不足表示遗憾 [3][6][51] - 合作包括Microsoft Azure建设(数千亿美元规模)、OCI建设(5-7吉瓦)及Core Weave项目 [23] 英伟达技术优势与竞争格局 - 英伟达系统总拥有成本(TCO)优势显著 即使竞争对手芯片价格为零 客户仍会选择英伟达系统 [4][7][75] - 英伟达芯片每瓦token数为其他芯片两倍 客户数据中心可产生两倍收入 [13][76] - 竞争格局从单一GPU芯片演变为复杂AI工厂系统 需处理多样化工作负载和指数级增长的推理任务 [2][64] 算力需求与供应链挑战 - 全球算力短缺主因是云服务厂商订单低估需求 英伟达长期处于紧急生产模式 [6][43] - 推理任务量预计增长十亿倍 因推理链、思考型AI及多模态应用出现 [12][17][46] - 供应链已准备就绪 可响应需求翻倍 但客户预测持续不足导致产能紧张 [43][44] 产品战略与技术路线 - 英伟达转向年度芯片发布周期 2024年推出Hopper 2025-2026年推Vera Rubin 2027年推Ultra 2028年推Fineman [53] - 通过极限协同设计(同时优化模型、算法、系统及芯片)实现性能指数级提升 如Blackwell比Hopper性能提升30倍 [55][57] - 推出CPX芯片处理上下文及视频生成 Dynamo系统实现分解式AI工作负载编排 [63][72] 主权AI与全球布局 - 每个国家需建设主权AI能力 因AI涉及国家安全、经济安全及文化价值观编码 [13][84][85] - 英伟达定位为AI基础设施合作伙伴 提供芯片、组件或完整系统解决方案 [81] - 美国再工业化及AI技术民主化将消除技术鸿沟 推动全球参与 [86][87] 行业影响与未来趋势 - AI与机器人技术融合将成为未来5年重点 实现个性化AI代理及数字孪生应用 [14][91][92] - AI代理产业快速增长 OpenAI成为历史上收入增长最快公司 [38] - AI非零和游戏 将创造更多工作机会及经济增量 而非单纯替代现有岗位 [8][88][89]
沪电股份-来自 ASIC、中板和大规模交换机的上行空间
2025-09-18 21:09
**行业与公司** 行业为人工智能(AI)相关印刷电路板(PCB)领域 公司为WUS Printed Circuit(002463 CH) 专注于高多层(>20层)高速低损耗PCB 主要客户包括思科、甲骨文、亚马逊和华为[1][12] **核心观点与论据** * **增长驱动因素**:受益于谷歌TPU需求从2025年下半年至2026年上半年走强 以及2026年起ASIC广泛采用全互联架构(all-to-all scale-up switches)带来的新PCB增量 同时英伟达Rubin平台将引入中背板PCB(mid-plane/back-plane PCB)替代线缆 进一步扩大PCB市场规模[1][2] * **技术升级趋势**:AI PCB规格持续升级 谷歌下一代TPU的PCB层数将从34层升至40层以上 材料从M7升级至M8混合材料 Meta的计算托盘PCB预计2026年采用36层以上M8混合PCB 而scale-up交换机和英伟达中背板PCB均需20-30层以上高端PCB[2] * **财务预测上调**:基于AI PCB需求强劲 将2025/26/27年盈利预测上调5.6%/11%/8% 预计2025年营收177.46亿人民币(原168.92亿) 归母净利润33.45亿(原31.68亿) 每股收益1.74人民币(原1.65)[4][14] * **估值与评级**:维持买入评级 目标价从41.22人民币大幅上调至86.80人民币 对应2025年38倍市盈率(原25倍) 接近其历史13-40倍区间高端 当前股价71.90人民币隐含20.7%上行空间[1][5][13] **其他重要内容** * **泰国工厂进展**:泰国工厂2025年上半年亏损约960万人民币 因二季度才小规模投产 已获得两家AI和交换机客户认证 预计2025年下半年再获四家客户认证 目标2025年底实现合理经济规模[3] * **财务指标优化**:预计净负债权益比从2024年17.5%降至2026年5.8% 2027年转为净现金 净资产收益率(ROE)维持在25%以上高水平[4][9] * **风险因素**:包括5G基站PCB需求放缓、数据中心需求不及预期、英特尔/AMD网络平台升级延迟以及汽车需求疲弱[13][26] * **ESG表现**:公司致力于水资源循环利用 回收率超过50%[14]
五大数据中心支出展望更新,2025 年第二季度同比增长 57%15%-US Communications Equipment-Updated Big Five Data Center Spend Outlook; +57%15% YY
2025-09-17 09:51
涉及的行业与公司 * 行业为美国通信设备行业 特别是数据中心基础设施和云计算领域[1] * 核心公司包括大型云服务提供商 即"五大云服务提供商" 以及Tier 2和其他云服务商[1][11] * 具体提及的公司有超大规模云服务商 谷歌 亚马逊 元 微软 甲骨文 以及专业GPU即服务提供商CoreWeave和xAI[5][7][9][11] * 硬件供应商方面提及英伟达 戴尔 超微 以及原始设计制造商[5][6][11] 核心观点与论据 **数据中心资本支出增长预测强劲** * 公司更新了对五大云服务商数据中心资本支出的预测 2025年同比增长57% 2026年同比增长15%[1] * 增长预期主要集中于人工智能相关支出 与市场包含全部资本支出的预测口径不同[1] **AI驱动因素明确且多样化** * 英伟达Blackwell Ultra平台的部署是服务器支出的主要驱动力[5] * 谷歌和亚马逊的自研定制加速器 也对支出做出贡献[5] * 网络和物理基础设施支出因AI平台预期而增加[6] * 四大云服务商同时在通用计算和AI计算上进行投资 特别是谷歌和亚马逊[7] **云服务商资本支出动态与战略** * 超大规模云服务商因宏观经济因素将需求前置 导致资本支出超预期 但这可能抑制企业支出[8] * 元公司和微软正在美国建设多个新数据中心 微软计划今年在11个新区域推出数据中心 元计划在未来2-4年进入14个区域[9] * 元公司可能因AI超级智能计划和持续扩张 其资本支出增速继续超过前四大云服务商[9] * 甲骨文计划在未来12-18个月在7个区域建设新数据中心[9] **新兴云服务商 第二梯队 增长显著** * "其他云服务商"领域的数据中心资本支出已连续四个季度增长超过23%[11] * 增长主要由采用加速计算的专业云服务商 即GPU即服务提供商 推动[11] * CoreWeave运营着32个数据中心 拥有超过25万个GPU 目标今年资本支出超过200亿美元[11] * xAI计划将其Colossus超级计算机的GPU部署从10万个增加到明年100万个[11] * 这些新兴云服务商倾向于从戴尔和超微等OEM购买商用服务器 而非ODM定制服务器[11] 其他重要内容 **供应链与库存状况** * 观察到DRAM和服务器组件库存增加 但尚未影响资本支出计划[9] * 谷歌的TPU 亚马逊的Trainium和Inferentia等高端定制加速器的部署量 今年可能超过商用高端GPU 而微软的Maia加速器遭遇延迟[9] * 通用服务器单位和前端交换机销售连续四个季度实现两位数增长[10] **宏观经济与政策影响** * 宏观经济可能推动企业向公有云迁移[10] * 折旧税收政策的变化和关税可能导致了需求前置[10] * 超大规模云服务商的需求前置是出于宏观经济因素考虑[8] **区域发展动向** * 一些GPU即服务提供商出现在中东 受益于较低的电力和土地成本 以及欧洲 以便更好地遵守地区法规[11]
2025年9月15日全球科技新闻汇总
海通国际证券· 2025-09-15 16:07
行业投资评级 - 报告未明确提供整体行业投资评级 [1][6][20] 核心观点 - 日本政府大力支持半导体产业 向美光提供最高5360亿日元(约36.4亿美元)补贴 用于下一代DRAM研发与量产 [1][2] - 苹果A20处理器将采用"三级分"策略 台积电2纳米制程获近半初期产能 供应链同步受益 [3][4][5] - Google采用"硬件即服务"模式推广TPU 以游击策略切入NVIDIA主导的算力租赁市场 [8][9][10] - xAI重组训练体系 裁撤500名数据标记员 转向扩大专业AI导师团队 [7][34][35] - AI模型能力持续突破 MiniMax Music 1.5支持4分钟音乐生成 Meta MobileLLM-R1小模型效率显著提升 [14][58][59] 半导体制造与投资 - 美光计划至2029年度投入1.5万亿日元 使广岛工厂具备月产4万片先进DRAM能力 预计2028年6-8月开始出货 [2][22] - 日本政府要求美光量产後至少持续生产10年 包含此次补助总额达7745亿日元 [3][24] - 日本经产省还对台积电熊本厂和铠侠四日市工厂提供补贴 确保先进半导体量产能力 [3][25] - 芯片分级策略将带动差异化代工与封装订单 台积电竞争对手面临量产与良率差距扩大风险 [5][30] 人工智能与算力生态 - Google Ironwood TPU单芯片算力达2.3 Petaflops 与NVIDIA B300的2.5 PFLOPS相当 完整Pod可整合9216颗芯片 [11][44] - OpenAI面临巨大成本压力 预计2029年前烧掉1150亿美元 仅2030年就需花费1000亿美元租赁服务器 [12][48] - xAI数据标记团队从超过1500人缩减至约1000人 未来专注STEM、编程、金融、医学等领域专家 [7][36][37] - 美团AI Agent"小美"基于5600亿参数Longcat模型 实现全自动点餐操作但尚无法处理复杂需求 [14][51][52] 技术创新与产品突破 - 苹果A20系列将对应折叠iPhone、iPhone Air和Pro系列 采用2+4核心CPU架构和不同GPU配置 [4][27] - MiniMax Music 1.5支持16种风格×11种情绪×10场景自定义 可生成民族乐器音色和段落分明作品 [14][49][50] - 小红书FireRedTTS-2支持多语言实时音频生成 B站IndexTTS2实现0.02%时长误差率精准口型同步 [15][53][57] - Meta MobileLLM-R1系列仅用2T token训练 950M模型性能媲美36T token训练的Qwen3 0.6B [16][58][59] - AI Gauss三周完成陶哲轩团队18个月未解数学难题 生成25000行Lean代码含上千定理定义 [16][61][62]
Oracle的4550亿订单,AI持续向好,TPU进展如何?
傅里叶的猫· 2025-09-10 20:29
甲骨文AI云收入指引 - 甲骨文给出未来5年AI云收入指引:2026年180亿美元、2027年320亿美元、2028年730亿美元、2029年1140亿美元[2] - 到2030年AI云收入预计再翻8倍[3] - 4550亿美元未执行订单为未来3-5年收入提供强力保障[3] - 未执行订单增长主要来自与OpenAI、xAI、Meta等公司的AI云基础设施合同[5] 海外云服务提供商资本开支与业绩 - Alphabet第二季度总收入964亿美元(同比+14%)、净收入282亿美元(同比+19%),2025年资本开支指引850亿美元用于AI基础设施[8] - Meta第二季度总收入475亿美元(同比+22%)、净收入183亿美元(同比+36%),2025年资本开支指引660亿-720亿美元用于AI服务器[8] - Microsoft第四财季总收入764.4亿美元(同比+18%)、净收入272亿美元(同比+24%),2025年资本开支指引800亿美元用于AI数据中心[8] 谷歌TPU出货量与价格分析 - 2025年TPU预计出货250万片:Q1 50万片、Q2 55万片、Q3 70万片、Q4 75万片[16] - V5系列占比76%(190万片),其中V5E 120万片、V5P 70万片;V6系列占比24%(60万片)[16] - 2026年TPU预计出货超300万片(同比+20%),V5系列80万片(V5E 30万片、V5P 50万片)、V6系列160万片、V7系列60万片(V7E 50万片、V7P 10万片)[19][20] - 2025年平均售价约4500美元,2026年预计升至4500-5000美元(涨幅约10%)[18] - 具体型号定价:V5E 3000美元、V5P 6000美元、V6E 4000美元、V6P 8000美元[19] - 2026年TPU营收预计150-160亿美元(同比+33%-42%)[21] 自研AI芯片竞争格局 - 海外云服务提供商自研AI芯片迭代激进(如AWS、谷歌、Meta每年迭代一次),国内昇腾910B和寒武纪590为几年前产品[8][10] - 2026年自研芯片出货量预估:博通TPU v7p+v8p 274.6万颗(收入257亿美元)、Meta MTIA v3 113万颗(收入29.4亿美元)、Trainium 3 81.3万颗(收入17.5亿美元)[13] 供应链与技术演进 - 谷歌TPU供应链中博通占比70%,联发科负责20%-30%后端生产(V7系列)[22] - 引入联发科目的为降本及分散供应链风险[22] - 芯片工艺持续升级(5nm/4nm→3nm/2nm),预计每年价格下降超5%[21]
从台湾供应链视角看全球半导体展望-SEMICON Taiwan 2025 Asia Pacific Investor Presentation Global semi outlook from Taiwan supply chain perspective
2025-09-09 10:40
全球半导体行业与AI服务器供应链关键要点 涉及的行业与公司 * 行业聚焦于全球半导体行业 特别是AI服务器供应链 包括云端AI资本支出 CoWoS先进封装 HBM内存以及定制化AI芯片(ASIC) [1][10][57][97][134] * 核心公司包括NVIDIA(主导AI GPU市场) TSMC(关键CoWoS产能提供者) 以及云服务提供商(CSP)如AWS Google Meta Microsoft 还有中国AI芯片厂商如华为[42][97][110][143][171] * 供应链涉及多家台湾ODM厂商如富士康(Foxconn) 纬创(Wistron) 广达(Quanta) 纬颖(Wiwynn) 英业达(Inventec)[58][66] 核心观点与论据 云端AI资本支出与半导体市场增长 * 摩根士丹利云端资本支出追踪器预估2026年十大上市全球云服务提供商(CSP)资本支出将达到5820亿美元 不含主权AI支出[13] * NVIDIA首席执行官预估2028年全球云端资本支出(含主权AI)将达到1万亿美元[15] * 受益于云端AI 全球半导体行业市场规模可能在2030年达到1万亿美元 AI半导体是主要增长动力[25][27] * 云端AI半导体总目标市场(TAM)在2025年可能增长至2350亿美元[25] NVIDIA GPU供应与需求预测 * TSMC预计在2025年生产510万颗芯片 而NVL72机柜出货量应达到3万台[42] * 对2025年GB200/300机柜产量转向更加乐观 预计约3.4万台 2026年至少6万台[49] * 看到来自Oracle对纬颖/广达的机柜需求增加 从8月开始[49] * 相信2025年第三季度机柜产量有望达到1.1-1.2万台 GB300机柜产量将从2025年第三季度末/第四季度初开始[49] 先进封装与制造产能 * CoWoS是主流的先进封装解决方案 随后将是SoIC[100] * TSMC可能将CoWoS产能扩大到2026年的9.3万片/月(93kwpm) 鉴于NVL72服务器机柜的瓶颈[105] * 全球CoWoS需求从2023年的11.7万片增长到2026年的100.4万片[110] * NVIDIA在2025年占据CoWoS产能分配的63%[110] * AI计算晶圆消耗在2025年可能达到150亿美元 NVIDIA占大部分[115] HBM内存需求 * 2025年HBM消耗量可能达到160亿Gb(15,578 mn Gb)[119][122] * NVIDIA在2025年消耗大部分HBM供应[121] 定制化AI芯片(ASIC)发展趋势 * 定制化AI芯片增长将超过通用芯片 定制化AI ASIC在2025年代表约210亿美元[139] * 增长前景 定制化AI半导体2023-30年复合年增长率39%[84][224] * 互联网公司开发云端AI定制芯片 Google TPU进入第六代 AWS AI训练解决方案Trainium AWS AI推理解决方案Inferentia Meta MTIA v1采用RISC-V核心 Tesla推出Dojo芯片 Habana开发Gaudi芯片[143][145] * AWS Trainium3将很快进入TSMC 3nm生产[147] 中国AI半导体需求与供应 * 预测前六大公司资本支出同比增长62% 达到3730亿人民币[162] * 中国AI应用在增长 2030年来自中国AI提升的总消费者使用量达到5560亿人民币[167] * 中国GPU自给率在2024年为34% 预计到2027年达到39%[178] * 预计中国云端AI总目标市场(TAM)在2027年达到480亿美元[180] * 本地GPU收入可能增长到1360亿人民币(2027年) 由中芯国际领先节点产能推动[182] 技术发展与性能比较 * TSMC的3nm以下在逻辑晶体管密度方面领先行业同行 每个节点迁移的每瓦性能(能效)可提高15%-20%[127] * 从感知AI到物理AI的趋势 生成式AI的计算需求呈指数增长[88][92] * 提供了NVIDIA AI GPU与Google TPU性能(INT8 TOPS)比较 以及主要AI GPU和ASIC的规格和成本比较[153][155] 其他重要内容 供应链与设计变更 * AI GPU服务器主板级检查(纬创)与NVIDIA GPU收入相关 是NVIDIA季度收入的良好指标[44] * GB300设计变更 – 回归Bianca设计 对连接器厂商Lotes和FIT负面 对PCB厂商Unimicron正面 对组装厂商纬创轻微负面[51] 投资风险与限制因素 * 增长限制包括 预算 能源 产能 监管[71][233] * 半导体解决方案包括 摩尔定律 CoWoS/SoIC HBM CPO 定制芯片[71][233] * 美国行政命令14032和出口管制参考 美国人士可能被禁止购买本报告提及实体的某些证券[3][4] 市场周期与库存 * 逻辑半导体Foundry利用率在2025年上半年为70-80% 尚未完全恢复[226] * 半导体供应链库存天数在2025年第二季度下降[227] * 排除NVIDIA的AI GPU收入 非AI半导体增长缓慢 2024年仅同比增长10%[231] 性能对比与中国市场 * 华为CloudMatrix 384 A3 SuperPod与NVIDIA NVL72的对比[188] * NVIDIA可供中国市场的芯片规格 包括L40S RTX 6000 Ada H20 RTX Pro 6000[193] * RTX Pro 6000系列产品均具有更好的FP8性能 而H20拥有更大的内存带宽[190][191]
自研AI芯片,可行吗?
半导体行业观察· 2025-08-26 09:28
文章核心观点 - 互联网公司自研AI芯片面临根本性挑战 核心矛盾在于芯片行业本质是制造业而非纯数字产业 需要完全不同的生产资料掌控能力、供应链管理能力和组织文化[4][5][7] - Google TPU成功的关键在于其能融合制造业与数字产业的差异化文化 而其他OTT企业缺乏这种包容性[4][7] - 自研芯片的真正价值不在于短期ROI计算 而在于通过提升研发效率缩短周期来应对AI技术的快速迭代 传统芯片开发周期需24-36个月无法匹配AI发展速度[8][10][12] 行业本质认知 - 芯片行业是伪装成高科技的制造业 最大特征是需要物理生产资料和极长产业链条 与OTT轻资产模式根本不同[5] - 芯片设计数字化部分只是中间产物 最终产品是硅/铜/铝混合的物理实体 涉及下单/备货/库存/检验等实体操作[6] - 制造业反馈环路长达三年才能看清成败 需要几代人积累制造流程经验 与OTT快速组织变化格格不入[6][7] 研发效率瓶颈 - 传统芯片开发流程中从Coding Done到GDS需4个月 GDS到硅片需4-6个月 总周期8-10个月[8][10] - 实际从开工到客户上电需36个月以上 这种速度无法适应AI技术快速演变[10][12] - 现有流程强求100%成功率反而阻碍创新 在不确定环境中应采用饱和攻击策略 接受30%成功率但多项目并行[12] 成本结构分析 - 自研AI芯片初始投资需20亿人民币起步 若量产1万颗则单芯片成本摊薄至20万元 量产10万颗成本仍达2万元[11] - 国内能单代芯片量产超10万颗的企业寥寥无几 盈利模式面临根本挑战[11] - 成本计算不应简单对比Nvidia采购价 需考虑团队长期价值观维持难题 内部服务团队易出现礼乐崩坏[7][11] 破局可能性 - 特斯拉和造车新势力启示在于效率革命 雷军半年推新款对比大众两年周期形成降维打击[12] - 潜在突破点在于将Coding Done到GDS周期从4个月压缩至1个月 去除可靠性测试等传统环节[10][12] - OTT企业擅长系统解构能力可应用于削减后天增加的流程复杂度 但需跨越制造业明坑[9][11][12]