Workflow
TPU Ironwood
icon
搜索文档
100页深度报告:半导体产业的发展复盘与方向探索
材料汇· 2025-12-26 22:58
全球及中国半导体市场概况 - 2024年全球半导体市场规模达6591亿美元,同比增长20.0%,预计2025年将增长至7893亿美元 [2] - 集成电路是半导体市场的核心支柱,2024年市场规模达4872亿美元,占比73.9% [14] - 人工智能芯片是增速最快的产品,2024年市场规模为689亿美元,同比增速高达49.3% [14] - 2024年中国半导体市场规模达1769亿美元,同比增长15.9%,预计2025年将达2067亿美元 [2] - 在中国市场,集成电路同样是占比最大的产品,2024年市场规模为1393亿美元,占比78.7%,人工智能芯片增速最快,达48.3% [16] - 2023年全球半导体市场份额前十企业以美国、中国台湾、韩国为主,中国大陆企业暂未入围,前三大为Intel、TSMC、Samsung [16] - 2023年中国半导体市场份额前十企业中,美国企业占5家,韩国2家,中国台湾1家,欧洲2家,前三大为Qualcomm、Intel、TSMC [18] 半导体应用领域与驱动因素 - 2023年全球半导体主要应用领域占比为:智能手机(19%)、个人电脑(17%)、服务器/数据中心及存储(15%)、汽车(15%)、工业电子(14%)、消费电子(11%)、有线和无线基础设施(9%) [2] - ASML预计,到2025年服务器/数据中心及存储与智能手机领域的半导体应用占比将分别上涨至23%和22% [12] - 全球半导体产业发展历经四大阶段:PC普及与互联网萌芽(1986-1999)、网络通讯与消费电子(2000-2010)、智能手机与3G/4G/5G迭代(2010-2020)、AI技术与数据中心(2023年至今) [3] - 当前八大云厂商资本开支持续扩容,直接推动AI服务器需求提升 [4] - 八大云服务厂商的资本开支从2021年的1451.0亿美元增长至2024年的2609.0亿美元,复合增长率达21.6%,预计2026年有望达到6020亿美元 [38] - 全球服务器市场规模从2020年的1360万台增长至2024年的1600万台,其中AI服务器占比12.5%,预计2030年将达1950万台,AI服务器占比将提升至33.3% [42] 半导体产业链转移与中国发展 - 全球半导体产业已历经三次区域转移,路径为美国→日本→韩国与中国台湾→中国大陆 [5] - 中国半导体发展以自主战略为核心,2003-2013年借加入WTO契机萌芽并获得政策支持,2014年后大基金持续加码投入,2018年后成为中美贸易战核心领域 [5] - 国家集成电路产业投资基金已开展三期投入,一期规模约1387亿元,二期2041亿元,三期达3440亿元 [57] - 大基金一期投资结构中,晶圆制造占比67%、IC设计17%、封测10%、装备材料6%;二期投资中,晶圆制造占比提升至76%,装备材料占比提高至11% [57] - 2018年后,美国多次升级对华半导体管制措施,将华为、中芯国际等众多中国企业列入实体清单,推动中国产业加速自主突破 [58] 半导体产业链上游:EDA/IP、设备与材料 - 半导体产业链上游主要涵盖EDA/IP、半导体设备、半导体材料三大关键环节 [6] - EDA/IP市场长期被Synopsys、Cadence、Siemens EDA等海外企业垄断,2024年全球EDA市场规模约157.1亿美元,前三大企业市占率达74% [81] - 国内EDA企业如华大九天持续推进技术迭代,2024年中国EDA市场规模为135.9亿元,华大九天占据6%的市场份额 [85][86] - 2024年全球半导体设备市场规模达1168.6亿美元,同比增长10.3%,预计2026年或将达到1381.2亿美元 [110] - 中国是全球最大的半导体设备进口市场,2024年全球半导体设备支出中,中国占比56% [110] - 2024年中国海外进口额居前的半导体设备分别是:光刻设备(107.24亿美元)、薄膜设备(77.17亿美元)、刻蚀剥离设备(64.29亿美元) [113] - 光刻机是芯片制造核心设备,EUV光刻机是7nm及以下先进制程的关键,目前全球仅ASML能实现量产 [6] - 2024年全球光刻设备市场规模达315.0亿美元,ASML占据61.2%的市场份额 [124][126] - 刻蚀设备市场主要由LAM Research、TEL、AMAT等海外龙头主导,2022年LAM Research市占率达47.0% [141] - 国内企业中微公司、北方华创、盛美上海、万业企业(凯世通)等已在半导体细分设备领域实现技术突破 [6] 半导体产业链中游:设计、制造与封测 - 半导体制造中游囊括半导体设计(Fabless)、晶圆制造(Foundry)及封测(OSAT)三大核心环节 [70] - 产业发展早期多采用IDM模式,20世纪80年代后,随着制程复杂度提升与建厂成本飙升,第三方晶圆代工(Foundry)模式崛起 [6] - 全球主要晶圆代工厂商包括TSMC、SMIC、UMC、Huahong Group等 [70] - 半导体下游封测涵盖封装和测试两大环节,2024年全球封测市场规模为899亿美元,同比增长4.9%,预计到2026年规模将达到961亿美元 [7] 半导体产业未来发展方向 - 第三代半导体材料、算力芯片、射频通信芯片与高宽带存储是半导体产业未来的核心发展方向 [8] - 第三代半导体材料如碳化硅、氮化镓凭借宽禁带等优势,适配新能源汽车、5G基站等高压高频场景,国内外厂商争相布局8英寸量产 [10] - 算力芯片中,GPU以高灵活性主导AI训练,ASIC因定制化高效优势在数据中心、边缘计算中占比持续提升 [10] - 射频通信芯片依托射频前端模组升级支撑多场景通信需求,国产厂商持续追赶国际龙头 [10] - 高带宽存储(HBM)凭借高带宽、低延迟特性成为AI服务器标配,技术不断迭代 [10]
Broadcom's Semiconductor Growth Picks Up: A Sign of More Upside?
ZACKS· 2025-12-25 01:05
Key Takeaways AVGO's AI revenues surged 74% year over year to $6.5B in Q4 FY25 as XPU adoption accelerated. AVGO landed $21B in Alphabet TPU Ironwood orders tied to Anthropic, expanding its AI customer base. AVGO expects Q1 FY26 AI revenues to double to $8.2B, driven by Tomahawk 6 and Jericho 4 demand. Broadcom’s (AVGO) Semiconductor revenues are benefiting from strong demand for XPUs, which are a type of application-specific integrated circuit (ASIC) necessary to train Generative AI (Gen AI) models. In the ...
1486亿!谷歌TPU拿巨额大单,博通CEO爆料
搜狐财经· 2025-12-12 12:43
博通业绩与AI芯片订单 - 博通2025财年第四季度营收同比增长28.2%,达到180.2亿美元,其中AI芯片销售增长74%,贡献82亿美元营收 [2] - 博通2025财年第四季度净利润同比增长96.99%,达到85.2亿美元 [2] - 博通收到来自Anthropic价值100亿美元的谷歌TPU Ironwood机架订单,本季度Anthropic又追加了110亿美元订单 [2] - 博通在未来18个月内还有价值730亿美元的未完成订单,涉及定制芯片、交换机和其他数据中心组件 [2] - 博通已获得继Anthropic之后的第五家XPU定制芯片客户,该客户在第四季度下了10亿美元订单,并且订单会继续增长 [4] - 博通此前已与OpenAI签订芯片购买协议 [4] 谷歌TPU的市场进展与生态 - 博通是谷歌TPU项目的重要合作伙伴,负责TPU芯片的工程实现工作,而谷歌主要负责TPU的顶层架构设计 [4] - 谷歌与Anthropic宣布了一项全面的云合作,协议估值达数百亿美元,使Anthropic能够访问多达100万张谷歌TPU [5] - 该合作预计将在2026年使超过1吉瓦的AI计算容量上线 [5] - 谷歌最先进的Gemini 3系列模型完全基于TPU进行训练 [5] - 谷歌已经开始将TPU作为服务广泛提供给云客户,甚至考虑向部分客户直接销售TPU [5] - 有消息称Meta和谷歌正在洽谈,从2027年起购买数十亿美元的TPU,直接部署在Meta自家的数据中心 [5] Anthropic的算力战略与行业影响 - Anthropic正采用多云多芯片战略进行算力布局,将AI工作负载分散到谷歌的TPU、AWS的Trainium芯片和英伟达的GPU上 [5] - Anthropic会针对训练、推理或研究等不同工作负载的芯片,对其模型进行调整以适应芯片特点 [5] - Anthropic大举购入TPU,被市场视为谷歌TPU需求强劲的积极信号,华尔街已将谷歌母公司Alphabet股价上涨与TPU需求紧密关联 [5] TPU的技术优势与行业挑战 - 谷歌最新一代TPU Ironwood的能效比为其前代TPU的6倍,达到约29.3 TFLOPS/W [6] - 在相同功耗下,TPU Ironwood的运算能力约为英伟达GB200的两倍 [6] - 电力已成为制约AI数据中心发展的重要瓶颈之一,微软CEO曾披露因电力短缺和物理空间不足,导致大量GPU闲置在库存中 [6]
AI芯片大战,愈演愈烈
半导体行业观察· 2025-12-07 10:33
文章核心观点 - 人工智能芯片市场正经历深刻变革,英伟达凭借其强大的硬件和CUDA生态维持着统治地位,但其高利润和高定价策略正促使主要客户谷歌和亚马逊自主研发AI芯片以降低成本,市场竞争加剧,未来市场格局可能从英伟达一家独大转向多极化 [1][3][12] 英伟达的市场地位与挑战 - 英伟达在AI芯片市场占据统治地位,最近一个季度数据中心GPU营收高达512亿美元,占总营收570亿美元的大部分,其GAAP毛利率高达73.4% [3] - 英伟达的高利润使其被称为AI时代的“军火商”,但高昂的GPU成本(加上HBM显存、存储、网络和电费)使得许多AI服务难以盈利,客户开始质疑其高价的可持续性 [3][4] 谷歌的竞争举措:TPU Ironwood - 谷歌推出第七代TPU Ironwood,是一款专为高吞吐量机器学习设计的AI加速器,提供4614 TFLOPS的FP8运算能力,配备192 GB HBM3e内存,带宽约7.3 TB/s [6] - Ironwood可通过多达9216个芯片连接成超级处理器,FP8运算性能超过40 exaflops,共享内存高达1.7 PB,谷歌将其称为人工智能超级计算机 [6] - 谷歌公开将Ironwood与英伟达即将推出的GB300比较,声称在FP8性能上具有优势,目前已在内部运行并通过部分Google Cloud AI实例提供 [6] 亚马逊的竞争举措:Trainium3 - 亚马逊AWS推出第三代AI芯片Trainium3,采用3纳米工艺,拥有2.52 FP8 petaflops运算能力、144 GB HBM3e显存及4.9 TB/s带宽 [8] - AWS将144个Trainium3芯片集成到EC2 Trn3 UltraServer中,单个机架可达362 FP8 petaflops运算能力、20.7 TB HBM3e内存及706 TB/s带宽,专为巨型模型训练设计 [8] - AWS的策略是为客户提供更便宜的AI基础设施以夺取英伟达的利润,并计划让下一代Trainium 4通过NVLink与英伟达GPU互操作,形成混合架构以降低总成本 [8] 英伟达的护城河:CUDA生态系统 - 开发者普遍偏爱英伟达,因为其CUDA生态系统自2006年以来已成为最先进的GPU编程平台,大量代码栈、流水线和自定义内核都针对CUDA优化 [10] - 将生产级AI工作负载从CUDA迁移到TPU或Trainium需要重写和重新调优复杂系统,实际转换成本与风险很高,这构成了英伟达强大的竞争壁垒 [10] 英伟达的反击策略 - 为应对竞争,英伟达在Blackwell架构尚未大规模部署时就提前发布了下一代Rubin架构及Vera Rubin NVL144系统 [11] - Rubin GPU目标为每个GPU提供50 petaflops的FP4推理性能,NVL144机架性能超过3.6 exaflops,是上一代GB300 NVL72的三倍多 [11] - 英伟达还推出配套推理芯片Rubin CPX,Vera Rubin NVL144 CPX机架组合目标实现8 exaflops的NVFP4性能、100 TB内存和1.7 PB/s带宽,其战略是通过加速产品路线图保持领先 [11] 未来市场格局的潜在情景 - 情景一:英伟达保持霸主地位但利润率下降,其70%的毛利率难以在谷歌、AWS和AMD的竞争下长期维持 [12] - 情景二:市场走向多极化,类似CPU市场分化,英伟达保持领先但不再拥有垄断权力 [12] - 情景三:AI泡沫破裂,企业支出放缓,但根据当前普及模式更可能表现为增速放缓而非崩溃 [12] - 最现实的路径是情景一和情景二的结合,即英伟达仍是行业巨头,但谷歌和亚马逊已开始蚕食其市场份额 [12] 对行业与用户的长期影响 - AI芯片竞争的结果将深刻影响未来十年计算机领域的规则,决定AI服务的成本、能力(如上下文长度、多模态处理)以及是否形成由专用芯片驱动应用演进的生态系统 [13]
Gemini3.0预热关注谷歌链,看好国产通信接口IP赛道
山西证券· 2025-11-20 07:30
核心观点 - 报告核心观点聚焦于两大投资主线:一是谷歌Gemini 3 0发布在即有望催化AI算力产业链情绪[1][2] 二是和顺石油拟收购奎芯科技事件凸显国产通信接口IP赛道的巨大市场潜力和投资价值[1][4] - 建议关注谷歌产业链 AI算力基础设施 通信接口IP及国产算力超节点相关公司[7][18] 行业动向与周观点 - 谷歌Gemini 3 0或近期发布 前期测试显示性能大幅提升 其展示的复杂任务能力表明token消耗仍在快速增长[2][13] 谷歌月token处理量从2024年4月的9 7万亿增长至当前的1000万亿 增幅超百倍[3][13] - 谷歌云发布第七代TPU Ironwood 其峰值性能较TPUv5p提升10倍 训推性能较TPU v6e均提升4倍以上 TPUv7预计2026年部署将拉动高端PCB 1 6T光模块 800G AEC 光交换机OCS等需求[3][13] - 和顺石油公告拟收购奎芯科技不低于34%股权并合计控制51%表决权 奎芯科技100%股权估值不高于15 88亿元[4][14] 奎芯科技2024年及2025上半年营收分别为1 93亿元和1 10亿元[4][14] - 奎芯科技业绩承诺为2025至2028年营收分别不低于3亿 4 5亿 6亿 7 5亿元 其中IP和高速互联产品收入分别不低于1 05亿 1 575亿 2 1亿 2 625亿元[4][14] - 奎芯科技产品覆盖UCIe HBM等多种协议接口IP 是国内少数能提供完整chiplet解决方案的企业 其UCIe chiplet互联IP已用于国产大芯片[4][14] - 2024年全球接口IP市场规模达23 7亿美元 占整个IP市场28% 是AI高算力发展下最受益的IP类别之一[4][14] 国产通信接口IP市场空间分析 - 市场空间主要来自五方面:国产AI芯片的chiplet趋势 通过UCIe协议实现模块化连接[4][15] 国产HBM颗粒与进口IP解耦及不同HBM间解耦 以提升灵活性和性能[4][16] - 与国产COWOS先进封装技术互补 共同促进AI芯片放量 例如奎芯科技ML100解决方案可降低Interposer尺寸和成本[4][16] 为适配不同国产超节点协议提供桥接解决方案[4][16] - 面向CPO OIO光互联进行布局 采用UCIe标准协议助力超节点规模扩展[4][16] Chiplet是国产AI芯片发展必然趋势 通信接口IP赛道受益于AI芯片出货量 chiplet渗透率 带宽及国产替代率多重增长动力[4][17] 投资建议 - 建议关注三大方向公司:谷歌链包括中际旭创 新易盛 光库科技 腾景科技 工业富联 瑞可达 长芯博创 汇聚科技[7][18] 通信接口IP链包括和顺石油 芯原股份 灿芯股份 润欣科技 概伦电子[7][18] - 国产算力超节点链包括华丰科技 鑫科材料 华工科技 中兴通讯 紫光股份 浪潮信息[7][18] 行情回顾 - 本周(2025 11 10-2025 11 14)市场主要指数普遍下跌 上证综指跌0 18% 沪深300跌1 08% 深圳成指跌1 40% 创业板指跌3 01% 科创板指跌3 85% 申万通信指数跌4 77%[8][18] - 细分板块中 液冷板块周涨幅最高达1 42% 其次为运营商涨0 03% 控制器跌0 78%[8][18] - 个股方面 剑桥科技 贝仕达克 数据港 英维克 海格通信涨幅领先 分别为+6 60% +5 83% +4 53% +1 33% +1 11%[8][32] 新易盛 源杰科技 意华股份 光迅科技 华工科技跌幅居前 分别为-11 21% -9 58% -8 67% -7 92% -7 89%[8][32]
谷歌开放TPU芯片!电子ETF(515260)下挫1.8%!机...
新浪财经· 2025-11-07 16:16
电子ETF市场表现 - 11月7日电子ETF场内价格下跌1.8%,成交额为3683.02万元,基金最新规模为6.58亿元 [1] - 成份股中闻泰科技涨停,江波龙和拓荆科技分别上涨3.49%和1.62% [1] - 成份股中工业富联、传音控股和沪电股份表现较弱,跌幅分别为4.62%、4.39%和4.23% [1] AI硬件与芯片行业动态 - 谷歌母公司Alphabet宣布其第七代自研AI推理芯片TPU Ironwood将在未来数周内全面开放给企业与开发者使用 [1] - 高通宣布推出AI200与AI250加速芯片,进军高端AI数据中心市场,为英伟达主导的格局注入竞争 [1] - 电子行业需求持续复苏,存储芯片价格上涨,国产化力度超预期 [1] 半导体行业趋势与资本支出 - TrendForce集邦咨询预计2026年全球云端服务大厂资本支出将增至6000亿美元以上,推动AI服务器等硬件需求进入新成长周期 [1] - 北美云厂商2025年三季度资本开支合计达1133亿美元,同比增长75%,资源高度集中于AI基础设施部署 [1] - 25Q2全球半导体设备销售额达331亿美元,同比增长23% [2] 国内半导体产业链发展 - 国内半导体设备厂商Q3营收大幅增长,反映下游晶圆厂进展顺利,且研发投入保持高速增长 [2] - 海外大厂Q3中国区营收快速增长,随着关键设备到位,国内先进制程扩产或提速 [2] - 电子50指数前十大权重股包括立讯精密、寒武纪、工业富联、中芯国际、海光信息等公司 [2]
全球要闻:美股重回避险状态纳指跌近2% 马斯克万亿美元“薪酬包”获批
新浪财经· 2025-11-07 14:44
美股市场表现 - 美股三大指数集体收跌,标普500指数跌1.12%至6720.32点,道琼斯指数跌0.84%至46912.30点,纳斯达克指数跌1.90%至23053.99点 [1][2] - 市场避险情绪升温,主要受美国企业裁员数据激增及OpenAI高管言论引发的AI泡沫担忧影响 [1][3] - 美股七巨头领跌,英伟达跌3.65%,微软跌1.98%,亚马逊跌2.86%,Meta跌2.67%,特斯拉跌3.50%,超微半导体跌7.27% [1][12] OpenAI相关动态 - OpenAI首席财务官Sarah Friar表示公司寻求由银行、私募基金及联邦政府"担保"的生态体系以支持巨额芯片投资,但随后澄清称并非寻求政府"兜底" [3] - OpenAI首席执行官奥尔特曼强调公司不会寻求政府为其数据中心提供担保,若公司失败则接受倒闭结果 [3] - 奥尔特曼预计OpenAI年化收入将超过2000亿美元,并在2030年达到"数千亿美元",计划推出企业级产品并进军消费电子和机器人领域 [3] - 美国政府AI事务专员大卫·萨克斯表示不会为AI产业提供联邦救助,但将简化许可流程并促进发电 [4] 美国劳动力市场数据 - 美国企业10月宣布裁员153,074人,同比跃升175.3%,创20年来最高水平 [4][23] - 今年以来美国裁员总数已突破100万,创疫情以来最高水平,同期企业招聘计划规模为2011年以来最低 [4][23] - 私人数据提供商Revelio Labs显示10月非农就业人数减少9,100人,前一个月为增加33,000人 [24] 特斯拉股东大会 - 超过75%的特斯拉投票股东批准马斯克的1万亿美元薪酬方案 [1][6][14] - 薪酬方案要求马斯克在十年内实现公司市值升至8.5万亿美元、交付100万台机器人及100万辆车投入Robotaxi服务等目标 [6][14] - 特斯拉股价盘后一度涨超3%,后转跌 [6] 科技行业产品发布 - 谷歌云正式发布第七代TPU芯片"Ironwood",性能较前一代提升4倍以上,可连接多达9,216颗芯片至单个集群 [13][24] - AI初创公司Anthropic计划使用多达100万颗新TPU运行其Claude模型 [24] 全球股市及商品表现 - 欧洲股市普遍下跌,英国富时100指数跌0.42%,法国CAC40指数跌1.36%,德国DAX指数跌1.31% [16] - 亚洲股市上涨,恒生指数涨2.12%,日经225指数涨1.34% [16] - 美元指数跌0.47%至99.733,失守100大关 [21] - 伦敦金现涨0.34%至3986.70美元/盎司,伦敦银现涨0.40%至48.204美元/盎司 [21] - 原油连续第四天下跌,WTI原油收跌0.17%至59.50美元/桶,布伦特原油微涨0.08%至63.57美元/桶 [21] 其他行业要闻 - 美国内政部地质勘探局更新关键矿产清单,首次纳入铜、银、铀及钾肥 [22] - 礼来、诺和诺德与美国政府达成减肥药降价协议,热门GLP-1减肥药定价将从每月至少1,000美元降至250-350美元 [25]
AI算力下半场,具备预期差的方向
格隆汇APP· 2025-09-11 20:40
文章核心观点 - ASIC芯片行业正在崛起 从AI算力需求的配角转变为主角 成为科技投资不可忽视的新势力[2] - 博通等ASIC厂商表现强劲 涨幅甚至超过英伟达 反映出科技投资格局的重大变化[2] - 全球ASIC芯片市场规模将从2024年120亿美元增长至2027年300亿美元 年复合增长率达34%[2] ASIC行业市场规模与增长 - 2024年全球ASIC芯片市场规模达120亿美元[2] - 预计2024-2027年市场规模将突破300亿美元 年复合增长率34%[2] - AI算力需求呈指数级增长推动ASIC从配角变身主角[2] 博通公司业绩表现 - 博通三季度AI芯片营收同比暴涨63%[5] - 获得第四家大客户价值100亿美元的定制AI芯片(XPU)订单[5] - 采用模块化ASIC架构 开发周期缩短 从谈判到落地仅用9个月[6] ASIC与GPU技术对比 - ASIC像定制菜刀 为特定任务优化 GPU像多功能瑞士军刀 能应对各种场景但不够极致[6] - ASIC在AI大模型推理场景中优势明显 过去设计周期18-24个月 现在压缩至6-12个月[6] - 成本降低60%以上 得益于IP核复用和云设计平台等技术革新[6] 海外巨头布局动态 - AWS Trainium2在同等预算下完成推理任务速度比英伟达H100更快 性价比提升30%-40%[8] - 谷歌第七代TPU Ironwood支持10MW级液冷机柜 FP8算力超越英伟达B200芯片[8] - Meta的MTIA系列ASIC计划采用170kW高功率液冷机架 专为短视频推荐算法优化[8] - 2024年云厂商自研ASIC占其算力采购量的25%[13] 技术优势指标 - AWS Trainium2的TOPS/W(每瓦算力)比英伟达H100高40%[9] - 谷歌TPUv4的三年总拥有成本(TCO)比GPU低55%[9] - 针对Transformer架构优化的ASIC 在自然语言处理任务中的延迟比GPU低30%[9] 国内厂商发展状况 - 寒武纪推出思元590芯片 采用Chiplet技术实现算力灵活扩展[7] - 某电信运营商使用寒武纪芯片搭建边缘计算节点 AI推理成本降低45%[7] - 中芯国际14nm FinFET工艺良率提升 支撑国内50%以上的ASIC量产需求[14] - 长电科技2.5D封装技术使ASIC互联带宽提升3倍[14] 产业链投资机会 设计端 - IDM巨头博通在数据中心互联场景占据60%份额[13] - 专业设计公司芯原股份ASIC定制服务收入从2022年8亿元增至2024年25亿元 年复合增长率超70%[10] 制造与封装端 - 北方华创刻蚀机已用于ASIC生产[14] - 中微公司薄膜沉积设备进入ASIC产线[14] - 通富微电提供Chiplet封装服务[14] 配套产业 - 液冷系统在ASIC服务器中成本占比达15%-20% 是普通服务器的3倍[11] - 光互联部件价值量随算力提升呈指数级增长[11] - 英维克提供浸没式液冷方案 单机柜液冷价值量是风冷的5倍[14] - 高澜股份冷板式液冷产品进入博通供应链 2024年相关收入增长翻倍[14] - 太辰光为博通XPU提供MPO连接器 每机柜光模块需求从16个增至48个[14] - 中际旭创光模块在ASIC集群中渗透率行业领先[14] 投资逻辑框架 - 看订单能见度 优先选择有长期大客户的厂商[17] - 看技术壁垒 关注拥有自主IP核和快速设计能力的公司[17] - 看配套弹性 液冷和光互联环节能获得更高业绩增长[17]
英伟达不再独霸?谷歌AI芯片算力追平B200
观察者网· 2025-04-10 13:50
文章核心观点 谷歌在 Google Cloud Next 25 大会推出第七代 TPU---Ironwood,这是专为支持大规模思考和 AI 推理模型设计的高性能芯片,标志着人工智能发展基础设施的转变,具备诸多优势且有应用计划 [1][3] 分组1:芯片基本信息 - 4 月 9 日谷歌在拉斯维加斯举办的 Google Cloud Next 25 大会推出第七代 TPU---Ironwood,是迄今性能最强的 TPU [1] - TPU 是 2015 年谷歌首次提出、2016 年正式发布的专为加速深度学习任务设计的人工智能芯片 [3] 分组2:芯片意义与需求 - Ironwood 推出标志人工智能及其发展基础设施从响应式人工智能模型到主动生成洞察和解读模型的转变 [3] - 推理时代 Agent 需主动检索和生成数据,实现这点需要满足巨大计算和通信需求的芯片及软硬协同设计 [3] 分组3:芯片性能参数 - Ironwood 最高配集群有 9216 个液冷芯片,峰值算力 42.5 ExaFlops(每秒运算 42500000000000000000 次) [3] - 是谷歌首款在张量核心和矩阵数学单元中支持 FP8 计算的 TPU,FP8 算力 4614 TFlops 略高于英伟达 B200,内存带宽 7.2TBps 略低于 B200 [5] - 芯片中第三代 SparseCore 加速器编码算法可加速金融和科学计算,最初设计用于加速推荐模型 [5] - 每瓦性能是第六代 TPU Trillium 的两倍,每芯片容量 192 GB 是 Trillium 的 6 倍,能处理更大模型和数据集 [6] 分组4:芯片对比数据 | | TPU v4 | TPU v5p | Ironwood | | --- | --- | --- | --- | | 推出年份 | 2022 | 2023 | 2025 | | Pod Size (chips) | 4896 | 8960 | 9216 | | HBM Bandwidth/ | 32 GB | 95 GB | 192 GB | | Capacity | @ 1.2 TBs HBM | @ 2.8 TBs HBM | @ 7.4 TBs HBM | | Peak Flops per chip | 275 TFLOPS | 459 FLOPS | 4614 TFLOPS | [6] 分组5:芯片应用情况 - 谷歌计划将 TPU v7 整合到谷歌云 AI 超算,支持推荐算法、Gemini 模型以及 AlphaFold 等业务 [6] - OpenAI 联合创始人 AI 初创公司 Safe Superintelligence 利用 Google Cloud 的 TPU 芯片支持 AI 研究 [7]