Workflow
谷歌TPU
icon
搜索文档
英伟达的“狙击者”
搜狐财经· 2025-08-19 00:22
AI推理芯片市场爆发 - AI推理芯片市场2023年规模为158亿美元,预计2030年将达到906亿美元,呈现爆发式增长[6] - 推理成本在18个月内从每百万token 20美元暴跌至0.07美元,下降280倍[6] - 企业AI硬件成本每年下降30%,能源效率每年提高40%[6] 训练与推理的差异 - 训练是AI系统的"启蒙教育"阶段,成本高昂且耗时漫长,具有一次性特征[4] - 推理是AI技术的"实战应用"环节,将训练好的模型知识转化为实际生产力[4] - 生成式AI时代技术架构变革使基础模型训练趋向稳定,推理成为持续创造价值的关键[5] 推理市场的商业价值 - AI推理工厂平均利润率普遍突破50%,英伟达GB200利润率高达77.6%[8] - 推理阶段是AI产业的"现金印钞机",通过向用户收取推理服务费实现盈利[6] - 英伟达数据中心40%的收入源自推理业务[6] 科技巨头布局推理市场 - AWS向客户推销自研推理芯片Trainium,并提供25%折扣[10] - OpenAI通过租用谷歌TPU降低推理成本和对英伟达的依赖[11] - 亚马逊向Anthropic投资40亿美元,后者使用AWS的推理芯片服务[11] 初创公司挑战英伟达 - Rivos寻求4-5亿美元融资,成立以来融资总额将超8.7亿美元[3] - 25家AI芯片初创公司共筹集超70亿美元,总估值达290亿美元[13] - Groq累计融资超10亿美元,与沙特达成15亿美元芯片合作协议[13] 技术差异化路径 - 初创公司聚焦AI专用芯片(ASIC)研发,以更低成本实现高效运算[12] - Rivos开发软件可将英伟达CUDA代码翻译成其芯片语言[12] - Groq开发独特语言处理单元架构,号称提供"世界最快推理"性能[13] 边缘推理市场机会 - 智能家居和穿戴设备催生海量边缘推理场景[14] - 小型分散的推理需求在英伟达视线未及的角落悄然爆发[14] - 新型算法架构与专用芯片结合正在诞生[14]
英伟达的“狙击者”
虎嗅APP· 2025-08-18 17:47
AI推理市场爆发式增长 - AI推理芯片市场规模2023年为158亿美元,预计2030年将达到906亿美元[7] - 推理成本在18个月内从每百万token 20美元降至0.07美元,下降280倍[7] - 企业AI硬件成本每年下降30%,能源效率每年提高40%[7] - 英伟达数据中心40%收入来自推理业务[7] 训练与推理的商业价值差异 - 训练阶段是高成本、高风险、长周期的"资本赌局"[6] - 推理阶段是持续创造价值的"现金印钞机"[6] - 生成式AI时代基础模型训练趋向稳定,推理成为主要价值创造环节[6] - 推理需求与商业收入形成良性循环,推动技术迭代升级[7] 科技巨头在推理市场的布局 - AWS向客户推销自研推理芯片Trainium,并提供25%折扣[12] - OpenAI通过租用谷歌TPU降低推理成本和对英伟达依赖[13] - 亚马逊向Anthropic投资40亿美元,后者使用AWS推理芯片[12] - 科技巨头平均利润率普遍突破50%,英伟达GB200利润率达77.6%[10] 初创公司的差异化竞争策略 - Rivos正在寻求4-5亿美元融资,累计融资将超8.7亿美元[4] - 25家AI芯片初创公司共融资超70亿美元,总估值290亿美元[17] - Groq累计融资超10亿美元,与沙特达成15亿美元芯片协议[17] - 初创公司聚焦ASIC芯片研发,在特定推理任务中具有性能优势[16] 技术架构与市场格局变化 - Transformer架构使基础模型训练趋向稳定[6] - MOE架构只需局部训练新信息,推动推理市场爆发[7] - 边缘侧小型分散推理需求正在爆发[18] - 推理对CUDA生态依赖较小,可使用多样化硬件平台[11]
AI 网络Scale Up专题会议解析
傅里叶的猫· 2025-08-07 22:53
加速器市场格局与Scale Up趋势 - 加速器市场分为商用市场(NVIDIA、AMD、Intel及初创企业)与定制市场(谷歌TPU、亚马逊Tranium、Meta MTIA等超大规模厂商自研芯片),定制加速器市场规模将与GPU市场持平但营收仍向GPU厂商倾斜 [3] - Scale Up网络正从小众走向主流,2025Q2营收首次突破10亿美元,未来将成为网络主流,定制加速器倾向于兼容以太网,NVIDIA则以NVLink为核心 [3] - AI网络从x86时代"单网络"发展为"双网络",当前处于多网络拓扑并存阶段,但最终可能收敛至1-2种,以太网被普遍认为是长期主流 [4] 技术路线竞争与演进 - Scale Out中以太网与InfiniBand的竞争已明确以太网胜出,Scale Up中NVLink与以太网竞争形成,NVLink短期占优但以太网将逐步扩大份额并成为主流 [5] - PCIe、UA Link等技术受限于规模与生态难以撼动以太网地位 [6] - Scale Up发展将经历三个阶段:单机架域依赖铜缆→多机架解决方案→硅光子学实现超大带宽扩展,市场规模存在显著上修空间(NVIDIA相关收入从1亿到10亿美元仅用一个季度) [7] Scale Up技术定义与性能 - Scale Up核心是GPU间缓存一致性网络,提供远高于Scale Out的带宽(Scale Out仅为其1/10),目前局限于单服务器或单机架但未来将扩展至多机架,长期市场规模有望超过Scale Out [8] - Scale Up与Scale Out存在显著代差:Broadcom产品中Scale Up延迟约250ns仅为Scale Out(600-700ns)的1/3,NVLink在速度与延迟上最优,以太网次之 [9] - Scale Up以太网产品价格预计为Scale Out的2-2.5倍(Scale Up sled约2.5万美元 vs Scale Out Tomahawk 5类产品6000-1万美元) [9] 厂商技术路径与市场潜力 - NVIDIA以NVLink为核心但长期将融入以太网生态,AMD押注UA Link但多机架扩展能力可能落后,超大规模厂商自研芯片未来将向以太网收敛 [13] - 当前AI网络Scale Up总潜在市场规模约600-700亿美元且可能上修至1000亿美元,以太网相关厂商(Broadcom、Cisco、Marvell等芯片厂商及Arista、Celestica等设备厂商)将成为主要受益者 [12] - Scale Up交换机长期将从独立设备转向嵌入机架,白盒设备因需兼容多厂商芯片复杂度提升可能呈现多厂商共存格局 [13]
中信证券:液冷市场空间扩容 看好国内企业出海的潜力
智通财经· 2025-08-07 08:55
行业趋势 - 谷歌、Meta、微软、AWS等云厂商定制ASIC芯片及英伟达GPU的AI服务器热设计功率密度提升,对液冷需求明确 [1] - ASIC芯片及英伟达GB300持续放量将大幅提升液冷渗透率,市场空间扩容 [1] - 预计2026年ASIC及英伟达GPU芯片出货量大幅增长,液冷市场空间显著提升 [2] 技术发展 - Meta与博通合作定制ASIC芯片,AI服务器热设计功率推高至180kW以上,使用液冷散热组件 [2] - 谷歌从TPU3.0开始使用液冷方案,AWS聚焦Trainium芯片,Meta MTIA芯片迭代至第二代 [2] - OpenAI计划采用台积电3nm及A16制程生产ASIC,预计2026年底量产 [2] 市场空间 - 液冷系统单KW价值量约8000元,其中CDU占比40%,液冷板占比20%-30%,UQD占比10% [2] - 假设2026年ASIC+GPU芯片出货量超1000万片,对应液冷市场空间约800亿元 [2] - 国内大陆厂商有望获得800亿市场空间的30%份额,对应240亿元收入体量 [3] 企业竞争力 - 国内大陆液冷企业在技术、产品质量、成本、服务等综合能力优秀,部分龙头厂已进入英伟达供应链 [1][3] - 国内企业在客户拓展、项目经验等方面有较大提升,预计未来更多公司成功出海 [3][5] - 北美液冷产业链集中于美国和中国台湾地区,国内企业具备全球市占率提升潜力 [3]
大摩详解台积电CoWoS产能大战:英伟达锁定六成,云AI芯片市场2026年有望暴增40%-50%
华尔街见闻· 2025-07-29 15:47
人工智能芯片封装产能争夺战 - 台积电CoWoS先进封装技术成为AI芯片战略要地 各大科技巨头展开产能争夺 [1] - 2026年全球CoWoS总需求预计达100万片晶圆 云AI半导体市场将增长40%-50% [1] - 英伟达锁定2026年60%的CoWoS产能(59.5万片) 台积电承接51万片用于Rubin架构芯片 [2][4] 主要厂商产能分配格局 - 英伟达2026年芯片出货量预计540万颗 其中240万颗来自Rubin平台 [2] - AMD将获得10.5万片(11%) 博通15万片(15%) 主要用于谷歌TPU和Meta定制芯片 [2][4] - 亚马逊通过Alchip预订5万片 Marvell为AWS/微软定制芯片预订5.5万片 [4] 产能技术路线分布 - 台积电2026年CoWoS-L技术将达51万片(英伟达) 50万片(博通) 70万片(AMD) [3][4] - 非台积电供应商中 Amkor为英伟达提供6万片CoWoS-R ASE/SPIL提供2万片 [3] - 博通14.5万片采用台积电CoWoS-S技术 AMD 10万片采用CoWoS-S技术 [3] 云服务商资本开支驱动 - 谷歌将2025年资本支出从750亿美元上调至850亿美元 2026年继续加速 [1][5] - 谷歌云平台token处理量从480万亿/月增至980万亿/月 实现翻倍 [5] - 全球顶级云服务商2025年资本支出同比增长预测从39%上调至43% [5] 台积电产能扩张计划 - 台积电CoWoS月产能将从2024年3.2万片提升至2026年9.3万片 [7] - AI相关收入2025年将占台积电总收入25% 成为最大受益者 [7] - 2025年全球CoWoS需求预计增长81% 2026年增长49% [5] 厂商年度增长趋势 - 英伟达2024年CoWoS需求预计增长280% 2025年增长113% [6] - AMD 2024年需求增长470% 2026年增长110% [6] - 博通2026年需求预计增长76% AWS+Alchip增长900% [6]
计算机行业2025年7月投资策略:IASIC市场规模快速增长,稳定币产业链蓄势待发
国信证券· 2025-07-15 13:17
报告核心观点 - 看好AI ASIC及稳定币领域投资机会,全球AI ASIC发展迅速,国内受芯片禁令影响互联网大厂或转向AI ASIC芯片,国产算力芯片2025年有望快速放量;香港《稳定币条例》落地,稳定币有望提升跨境支付效率 [3][99] AI ASIC芯片 AI Asic芯片价格、功率优势明显,市场规模快速增长 - AI芯片有CPU、GPU、FPGA、ASIC等类型,ASIC性能高、体积小、功率低,经历CPU、GPU阶段后,2016年Google发布TPU芯片使ASIC成为AI芯片重要分支 [12] - 相比GPU,AI ASIC芯片价格优势明显,2024年GPU平均单价8001美元,AI ASIC平均单价5236美元,预计2030年分别为10667、5851美元;且功率更低,能耗优势明显 [14] - 2024年GPU、AI ASIC芯片市场规模分别为701、148亿美金,预计2030年分别增长至3263、838亿美金,对应24 - 30年CAGR分别为29.2%、33.5%;出货量分别为876、283万颗,预计2030年增长至2982、1431万颗,对应24 - 30年CAGR分别为22.6%、31.0%,ASIC在训练、训练&推理双用领域增速快于GPU [18][20] 复盘谷歌TPU:更专用、强算力、大集群、高能效 - 谷歌TPU发展历程:2015 - 2025年陆续发布TPU v1 - v7,功能不断拓展,性能和能效逐步提升 [26] - AI ASIC芯片发展趋势:专用性持续增强,颗粒度更细,如TPU v5分v5e和v5p版本;算力、HBM和集群能力更强,单卡算力、HBM水平和单POD芯片数量提升,集群拓展效率接近线性;能效比持续提升,如Ironwood峰值能效是上一代Trillium的2倍,TPU v3开始配套液冷 [2][83] 稳定币 香港《稳定币条例》落地,以合规框架激活数字金融创新 - 稳定币与目标资产基本挂钩,减小价格波动,具备数字货币便捷性和透明度以及法币稳定性,中心化模式的美元稳定币(USDT、USDC)占主导地位 [84] - 香港于2025年5月21日通过《稳定币条例》,明确稳定币定义与类型,强化资本充足性与储备隔离要求,为合规发行提供制度基础,受益方包括沙盒参与者、跨境支付服务提供商、RWA项目方 [85] 稳定币蓬勃发展,跨境支付+RWA有望收益 - 跨境支付:稳定币在交易速度、成本和体制方面优于传统跨境支付体系,绕开SWIFT体系低效性,实现近乎实时跨境转账,降低成本,减少限制,提升普惠性,香港有望成核心枢纽 [88][93] - RWA:稳定币通过价值锚定等破解RWA项目痛点,推动传统资产数字化转型,重塑全球资产配置规则 [96] 投资建议 - 建议关注AI ASIC领域的海光信息等公司,以及稳定币领域的新大陆等公司 [3][99] 重点公司盈利预测及投资评级 | 公司代码 | 公司名称 | 投资评级 | 昨收盘(元) | 总市值(百万元) | EPS(2025E) | EPS(2026E) | PE(2025E) | PE(2026E) | | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 688041 | 海光信息 | 优于大市 | 136.10 | 316,342 | 1.69 | 2.36 | 80.53 | 57.67 | | 000997 | 新大陆 | 优于大市 | 32.71 | 33,759 | 1.18 | 1.42 | 27.72 | 23.04 | [4]
小摩:HBM短缺料延续至2027年 AI芯片+主权AI双轮驱动增长
智通财经· 2025-07-07 17:13
HBM市场供需与技术趋势 - HBM供应紧张局面预计将持续至2027年,2026-2027年供应过剩逐步缓解,渠道库存预计增加1-2周 [2] - 三星HBM认证延迟叠加英伟达Rubin GPU位元需求增长是当前供需紧张主因 [2] - HBM4位元供应量2026年预计占比30%,2027年HBM4与HBM4E合计占比超70% [2] - 市场规模2026年同比增长超70%,占DRAM总TAM的45%、总位元需求的10% [2] - 2027年Vera Rubin GPU(1024GB容量)推出将成为主要增长动力 [2] 需求端驱动因素 - 2027年HBM位元需求重新加速,核心驱动力来自Vera Rubin GPU和AMD MI400(432GB HBM) [3] - 2024-2027年ASIC/英伟达/AMD位元需求CAGR超50%,英伟达2025-2027年位元占比超60% [3] - 谷歌TPU到2027年占ASIC总需求超50% [3] - 主权AI需求成为新变量:沙特计划投资100亿美元采购1.8万颗英伟达GPU,韩国推出100万亿韩元主权AI计划 [3] 定价与成本结构 - HBM4较HBM3E12Hi预计有30-40%价格溢价以弥补更高芯片损耗 [4] - 逻辑芯片成本占比高:4nm逻辑芯片晶圆成本13-14k美元/片,12nm约9-10k美元/片 [4] - 单颗Rubin GPU(8个HBM立方体)系统成本1000-1400美元 [4] 市场竞争格局 - 三星因认证延迟导致份额下滑,美光预计抢占其份额 [5] - 美光2025Q3 HBM营收环比增50%,季度营收运行率达15亿美元 [6] - SK海力士HBM4第六代产品份额预计保持60%以上领先 [6] 行业长期影响 - HBM推动DRAM进入5年上行周期,2030年占DRAM营收比例将从19%提升至56% [7] - 2025-2030年DRAM ASP CAGR 3%,高于历史周期 [7] - 三大厂商DRAM资本开支持续增长,2025年侧重基础设施,2026年后设备开支加速 [7]
AI日报丨领先英伟达!李斌称蔚来ET9搭载全球首颗5nm智驾芯片,量产比英伟达还早三个月
美股研究社· 2025-07-02 19:39
AI行业动态 - 北美大型CSP和中东欧洲主权云项目推动AI服务器需求稳健 2025年AI服务器出货量预计维持双位数增长 但2024年全球AI服务器出货量增速微调至24 3% [3] - Anthropic年化收入达40亿美元 较年初增长近四倍 [4] - OpenAI与Meta爆发人才争夺战 Meta新成立超级智能团队包含OpenAI前员工 OpenAI正评估研究团队薪酬 [4] 智能手机市场 - 杰富瑞下调2025-2027年智能手机销量预期2-4% 主因美国关税政策不确定性 安卓库存高企和中国补贴减少 [6] - 中国618期间iPhone销量同比增长19% 远高于去年7%的增幅 推动中国市场本季度增长约10% [7] - 安卓设备在618期间仅增长1% 海外库存高于中国市场 预计下半年将持续面临折扣压力 [7] 芯片与硬件 - 蔚来ET9搭载全球首颗车规级5nm智驾芯片 量产时间比英伟达早三个月 [4] - OpenAI否认计划大规模采用谷歌TPU芯片 目前仅进行早期测试 主要依赖英伟达GPU和AMD AI芯片 [8][9] - 谷歌未向OpenAI提供最强性能TPU 保留最先进版本用于内部Gemini等项目 [9][10]
AI芯片不再依赖英伟达转投谷歌? OpenAI回应
凤凰网· 2025-07-01 08:24
芯片合作与算力需求 - OpenAI目前没有计划大规模部署谷歌自研的TPU芯片,仅进行初步测试 [1] - 公司首次大规模使用非英伟达芯片,开始租用谷歌TPU以降低推理成本 [1] - 谷歌TPU有望成为英伟达GPU的更便宜替代品 [1] 算力来源与硬件策略 - OpenAI仍主要依赖英伟达GPU和AMD的AI芯片满足算力需求 [1] - 公司正在自主研发芯片,预计今年达到"流片"关键节点 [1] - 大部分计算能力来自新兴云服务公司CoreWeave提供的GPU服务器 [2] 云服务合作 - OpenAI已签约使用谷歌云服务以满足算力增长需求 [2] - 这一合作标志着AI领域两大竞争对手之间的罕见合作 [2]
美股前瞻 | 三大股指期货齐涨,特朗普认为无需延长7月9日关税大限
智通财经网· 2025-06-30 20:25
美股市场表现 - 6月30日美股盘前三大股指期货齐涨 道指期货涨056% 标普500指数期货涨041% 纳指期货涨062% [1] - 标普500指数自2月以来首次重返历史高点 上周上涨35% 纳斯达克综合指数上涨超过41% 均以历史新高收盘 [4] - 第二季度标普500指数飙升10% 远超同期仅上涨不到2%的欧洲斯托克600指数 [5] 欧洲市场表现 - 德国DAX指数跌006% 英国富时100指数跌017% 法国CAC40指数涨003% 欧洲斯托克50指数跌013% [2] - 欧洲斯托克600指数第二季度仅上涨不到2% 表现远逊于美股 [5] 原油市场 - WTI原油跌038% 报6527美元/桶 布伦特原油跌022% 报6665美元/桶 [3] 贸易政策动态 - 特朗普表示无需延长7月9日关税期限 甚至考虑提前对日本征收25%关税 [4] - 投资者紧盯7月9日关税暂停期限的最新动态 [4] 科技行业动态 - 资金加速回流美国科技巨头 科技股重拾涨势 [5] - 英伟达高管过去一年累计出售逾10亿美元公司股票 其中本月抛售约5亿美元 [7] - OpenAI开始使用谷歌TPU芯片 首次实质性转向非英伟达芯片 [8] - Meta从OpenAI挖走4名核心AI研究员 包括多个关键项目主导者 [10] 公司动态 - 瑞银启动高达20亿美元股票回购计划 预计7月1日启动 [9] - 英伟达市值超过38万亿美元 首席执行官黄仁勋近期首次出售公司股票 [7] 经济数据与政策 - 美国6月非农就业报告成为市场关注焦点 [4] - CBO估计特朗普税收和支出方案将使美国十年内赤字增加近33万亿美元 [5] - 高盛预警标普500 EPS增幅或创两年来最低 反映10个百分点关税上调的利润冲击 [6] 重要经济事件预告 - 美国6月芝加哥PMI和达拉斯联储制造业活动指数将公布 [10] - 美联储官员博斯蒂克和古尔斯比将发表讲话 [10] - 欧洲央行行长拉加德将发表讲话 [11]