Workflow
Trainium芯片
icon
搜索文档
挥刀中国,豪赌续命:Claude停服背后的算力危机 | Jinqiu Select
锦秋集· 2025-09-05 23:17
文章核心观点 - Anthropic暂停向中国用户提供Claude服务 表面是合规动作 实则反映其长期算力困境与战略收缩 通过关闭部分市场为欧美核心客户腾出资源 [1][2] - Anthropic在算力供给上捉襟见肘 Claude 4系列走红导致用户需求井喷 频繁触发额度收紧与服务降级 [2] - 生成式AI竞争已演变为算力供给 芯片路线 数据中心规模与资本布局的综合博弈 Anthropic的封禁动作和芯片豪赌都是算力危机推演出的应对策略 [3] - Anthropic押注亚马逊自研Trainium芯片 以近百万颗芯片级别的数据中心扩展换取增长 这一合作对AWS AI云业务具有长期意义 [3][20] - AI创业成败关键是在不确定性中找到生存解法 算力长期是AI创业最大瓶颈 无论大模型公司还是应用层创业者都可能受影响 [4] Anthropic算力困境与战略收缩 - Anthropic突然暂停向中国用户提供Claude服务 引发广泛关注 对开发者和企业意味被挡在全球头部大模型之外 [1] - 公司算力供给捉襟见肘 Claude 4系列走红导致用户需求井喷 频繁触发额度收紧与服务降级 [2] - 停服中国是算力吃紧下的被动收缩 通过关闭部分市场为欧美核心客户腾出有限资源 [2] - 生成式AI竞争是算力供给 芯片路线 数据中心规模与资本布局的综合博弈 [3] Anthropic与AWS的战略合作 - Anthropic押注亚马逊自研Trainium芯片 以近百万颗芯片级别的数据中心扩展换取增长 [3][20] - 2023年9月AWS向Anthropic投资12.5亿美元 可扩展至40亿美元 2024年3月合作扩大 Anthropic承诺使用Trainium和Inferentia芯片 [30] - 2024年11月亚马逊追加投资40亿美元 Anthropic将AWS指定为主要LLM训练合作伙伴 [30] - AWS为Anthropic准备的数据中心容量远超一千兆瓦 建设速度非凡 未来还有更多规划项目 [17][35] - 三个处于建设最后阶段的AWS园区拥有超过1.3GW的IT容量 唯一目的是服务Anthropic训练需求 [35] Trainium芯片的技术经济学逻辑 - Trainium2是全球最大的非英伟达AI芯片集群 最大园区将拥有近一百万颗Trainium2芯片 [20] - Trainium2在单位内存带宽的TCO优势完美契合Anthropic激进的强化学习路线图 [20][54] - Trainium2资本成本0.43美元/小时/GPU 运营成本0.23美元/小时/GPU 总拥有成本0.66美元/小时/GPU [21][53] - 在单位内存带宽TCO方面 Trainium2相比英伟达有30.1%优势 [21][53] - Trainium2理论BF16密集TFLOP/s/芯片为667 HBM容量13GB/芯片 HBM带宽2900GB/s/芯片 [48] - 虽然芯片规格落后 但单位内存带宽TCO优势使其具有竞争力 [49][50] AWS的AI云业务前景 - AWS贡献亚马逊集团约60%利润 但在GPU/XPU云时代难以将优势转化为竞争力 [12] - 微软Azure在季度新增云收入方面领先市场 谷歌云与AWS差距显著缩小 [12] - SemiAnalysis预测AWS人工智能业务将迎来复兴 到2025年底年同比增长率加速超过20% [14] - Anthropic在2025年生成式AI市场表现突出 收入增长五倍 年化收入达50亿美元 [18][31] - AWS三个大型园区将在2025年底为营收做出重要贡献 将增长率推高至20%以上 [38] 芯片技术路线比较 - Trainium2在纵向扩展网络使用NeuronLinkv3 带宽512GB/s/芯片单向 [48] - 新系统架构Teton PDS和Teton Max引入NeuronLinkv3全互联纵向扩展网络 [57] - Trainium架构正向英伟达NVL72 NVLink靠拢 四个NeuronLinkv3交换机托盘放置在机架中间 [57] - 英伟达GB200 NVL72在整个World Size拥有总计576TB/s内存带宽 Trainium2 Teton2-PD-Ultra-3L为186TB/s 差距3.1倍 [52] - 英伟达GB200在FP16浮点运算性能上具有3.85倍优势 内存带宽差距2.75倍 [51] Anthropic的扩张与融资 - Anthropic以1830亿美元估值进行约130亿美元融资 为其提供与AWS 谷歌等签署额外协议的资金 [40] - 公司不仅成为Trainium2唯一大型外部最终用户 规模也显著超过亚马逊内部需求 [54] - Anthropic深度参与所有Trainium设计决策 将Annapurna Labs当作定制芯片合作伙伴 [54] - 这使得Anthropic与Google DeepMind成为唯二受益于紧密软硬件协同设计的AI实验室 [20][54] - Anthropic在2026年的TPU扩张规模巨大 交易具有独特性 [58]
AI日报丨超预期!芯片巨头博通盘前涨超7%,交出满分财报,与OpenAI“百亿大单”曝光
美股研究社· 2025-09-05 19:53
AI半导体行业动态 - 博通第三财季调整后净营收159.5亿美元超预期 分析师预期158.4亿美元[5] - 第三财季AI半导体营收52亿美元超预期 分析师预期51.1亿美元[5] - 第四财季营收指引174亿美元超预期 分析师预期170.5亿美元[5] - 第四财季AI半导体营收指引62亿美元超预期 分析师预期58.2亿美元[5] - 获得价值超100亿美元AI加速器生产订单 客户疑似OpenAI[5][6] - 积压订单总额达1100亿美元创纪录 2026财年AI收入增长率将显著改善[6] 自动驾驶与AI芯片合作 - Waymo将于2025年秋季在加州圣何塞机场启动无人驾驶测试[7] - 英伟达与Lambda达成15亿美元AI芯片租赁协议[7] 云计算与AI芯片发展 - 亚马逊股价上涨3% 因与Anthropic合作推动数据中心建设[11] - AWS为Anthropic建设三个数据中心园区 总容量达1.3千兆瓦[11] - 数据中心将部署近100万个Trainium2芯片 形成最大非英伟达AI芯片集群[11] - Anthropic参与芯片设计过程 使芯片适配其大型语言模型需求[11] - Anthropic主要收入来自高价值企业交易 与OpenAI消费级订阅模式形成对比[12]
剥离汽车业务轻装上阵,大摩看好迈威尔科技(MRVL.US)业绩指引超预期
智通财经网· 2025-08-26 15:33
核心观点 - 摩根士丹利预计迈威尔科技在公布季度业绩时可能给出优于预期的业绩指引 主要受近期剥离汽车以太网业务及市场对亚马逊Trainium芯片担忧影响 [1] - 市场普遍预期迈威尔科技2026财年第二季度调整后每股收益为0.67美元 营收为20.1亿美元 [1] - 摩根士丹利对迈威尔科技人工智能业务增长持乐观态度 特别看好光学业务前景 认为其比ASIC业务更持久且利润率更高 [1] - 摩根士丹利对美光科技未来几个季度的HBM内存业务持谨慎态度 预计将面临负面情绪 [1][2] 财务业绩预期 - 迈威尔科技2026财年第二季度财务业绩将于8月28日美股盘后公布 [1] - 市场普遍预期该公司当季调整后每股收益为0.67美元 营收为20.1亿美元 [1] - 已剥离的汽车以太网业务在2026财年原预计贡献2.25亿至2.5亿美元营收 [1] 业务剥离影响 - 迈威尔科技以25亿美元价格完成汽车以太网业务出售给英飞凌的交易 [1] - 摩根士丹利在剥离汽车业务后略微下调预期 但排除该影响后预计业绩指引呈积极态势 [1] 人工智能业务表现 - 迈威尔科技人工智能业务收入在7月财季预计为8.76亿美元 环比增长6.6% [1] - 10月财季预计为9.55亿美元 环比增长9.0% [1] - 增长较快的是专用集成电路业务 [1] - 预计今年ASIC业务收入将稳步达到20亿美元 [1] 光学业务前景 - 摩根士丹利预计本季度光学业务将带来上行潜力 [1] - 在强劲人工智能增长势头推动下 光学业务表现可能超出预期 [1] - 光学业务比普遍认为的更强劲 比ASIC业务更持久且利润率更高 [1] 美光科技业务展望 - 美光科技在未来几个季度将面临负面情绪 [1] - HBM 3e高带宽内存定价2025年将与英伟达进行硬重置 英伟达已承诺2025年全年定价 [2] - HBM将保持对DDR5有意义的溢价 尽管溢价幅度在收窄 [2]
数据中心互联技术专题四:CSP云厂AI军备竞赛加速,智算中心架构快速发展
国信证券· 2025-08-24 15:36
行业投资评级 - 投资评级:优于大市(维持评级)[1] 核心观点 - CSP云厂AI军备竞赛进入2.0时代,智算中心互联技术快速迭代[2] - AI芯片性能加速升级,带动光通信、铜连接、液冷等技术显著受益[3] - 全球CSP厂商资本开支大幅增长,海外四大厂商2025年合计Capex预计达3610亿美元(同比增超58%),国内三大厂商Capex有望超3600亿元[2] - 自研ASIC芯片成为CSP云厂发展核心,Google、AWS、Meta等头部厂商均布局自研算力集群[4] - 新技术如CPO、OCS、铜背板等快速发展,光模块/铜连接市场需求快速增长[5] CSP军备竞赛与AI算力基建 - AI大模型训练需求持续增长,多模态模型和AI agent推动token消耗量爆发式增长(如Google token用量从5月月均480e增至7月980e)[9][11] - 海外头部云厂商资本开支持续攀升,2025年Google Capex上调至850亿美元,Meta达660-720亿美元,微软FY2025达800亿美元[28] - 国内CSP厂商2025年Q1资本开支显著增长,阿里增126.7%,腾讯增91%[19] - CSP厂商加速自研ASIC芯片,如Google TPU、AWS Trainium、Meta MTIA等,推动算力集群定制化发展[29] 算力芯片厂商技术迭代 - 英伟达AI芯片架构迭代周期缩短至2年,网络连接速率从400G演进至1.6T[3][59] - 英伟达H200为主流产品,GB200 NVL72架构采用铜连接(GPU:400G DAC=1:36)和光模块(GPU:800G=1:1.5~2.5)[65][68] - 华为CloudeMatrix384超节点性能多项指标超越GB200,BF16算力达300 PLOPS(英伟达1.7倍),HBM带宽1229 TB/s(英伟达2.1倍)[90] - AMD计划2026年推出Helios AI集群,整合CPU+GPU+NIC实现生态闭环[82] CSP云厂自研芯片与数据中心网络 - Google自研TPU已至第七代(Ironwood),采用3D环面网络互联,机柜间使用OCS全光交换(TPU:400G光模块=1:1.5)[98][104][111] - AWS Trainium2机柜内互联以铜连接为主(Trainium2:400G DAC=1:9),2026年Trainium3将采用背板方案[115][120] - Meta Minerva架构基于自研MTIA-T芯片,机柜内采用铜连接(MTIA:800G DAC=1:12),Scale-out网络光模块配比达1:12[124] - 国内腾讯、阿里、字节等积极设计定制化数据中心架构,如腾讯ETH-X、阿里ALS项目[133][137] 新技术发展趋势 - 2025年全球800G光模块需求预计达4000万只,1.6T光模块超700万只[5][142] - CPO技术渗透率预计2029年达50%,OCS市场规模超16亿美元,PCIe Switch达50亿美元,DCI市场达284亿美元[5][188][189][195] - Scale-out方向CPO/OCS成为主流,Scale-up方向铜连接向正交背板演进[149][154][166] - OIO技术实现算力芯片光互联,MicroLED可能成为新光源[174][178] - 空芯光纤可降低传输时延30%,DCI技术向相干传输升级[182][184] 投资建议 - 推荐关注光模块厂商(中际旭创、新易盛、光迅科技、华工科技)、光器件厂商(天孚通信、长芯博创、太辰光、仕佳光子)、铜连接厂商(兆龙互联)及通信设备商(中兴通讯、紫光股份、锐捷网络)[5][202]
通信行业周报(第三十一周):北美云CapEx,2Q同比高增,坚定算力信心-20250804
华泰证券· 2025-08-04 17:56
行业投资评级 - 通信行业维持"增持"评级 [3] - 通信设备制造子行业维持"增持"评级 [3] 核心观点 - 北美四大云厂商(MAMG)2Q25合计资本开支同比增长69%至874亿美元,市场预期2025年资本开支将达3338亿美元(同比+49%) [1][4] - 云厂商持续上调资本开支指引:谷歌上调至850亿美元,Meta上调至660-720亿美元,微软预计3Q25超300亿美元,亚马逊预计下半年维持2Q投资强度 [4][16] - 海外CSP资本开支高增将提振全球AI算力链需求,建议关注光模块、液冷、铜连接、交换机等配套产业链 [1][14] 市场表现 - 上周通信(申万)指数上涨2.54%,跑赢上证综指(-0.94%)和深证成指(-1.58%) [1][14] - 通信设备制造子板块周涨幅达5%,显著领先通信运营(-1.75%)和通信服务(0.5%) [8] - 周涨幅前十个股中通信设备占7席,天孚通信(+25.17%)、英维克(+29.64%)领涨 [10] 云厂商资本开支详情 - 2Q25资本开支同比增速:Meta +102%、亚马逊 +91%、谷歌 +70%、微软 +23% [16] - 2025年指引:微软未给出全年指引但预计3Q25超300亿美元,亚马逊预计下半年季度投资率18.7%(较1Q25提升3.1pct) [4][16] - 历史数据:MAMG合计资本开支从1Q24的433亿美元增至2Q25的874亿美元,同比增速从32%提升至69% [17] 重点推荐方向 - AI算力链:天孚通信(目标价119.12元)、锐捷网络(88.70元)、华丰科技(59.86元) [9][50] - 核心资产:中国移动(126.40元)、中国电信(9.13元)、中国联通(7.62元) [9][50] - 新质生产力:华测导航(47.26元)、亨通光电(20.37元) [9][50] 行业动态 - 5G-A进展:中兴通讯展示10ms低时延极简专网,上海电信为WAIC部署上行2Gbps网络 [22][23] - 卫星互联网:我国成功发射低轨06组卫星,创"三天两发"组网纪录,GW星座规划12992颗卫星 [29] - 运营商集采:中国联通启动79.6亿元服务器采购,国产芯片占比超90%(鲲鹏48,150台+海光30,245台) [24] 技术创新 - 月之暗面发布KimiK2高速版,输出速度提升至40 tokens/秒 [26] - 阿里通义千问推出Qwen3-30B推理模型,支持256K上下文并在数学评测中超越Gemini2.5 [27] - 中国移动量子计算云平台并网超1310量子比特,服务客户超120万次 [28]
北美云CapEx:2Q同比高增,坚定算力信心
华泰证券· 2025-08-04 10:21
行业投资评级 - 通信行业评级为增持(维持)[8] - 通信设备制造子行业评级为增持(维持)[8] 核心观点 - 北美四大云厂商(微软、亚马逊、Meta、谷歌)2Q25合计资本开支同比增长69%至874亿美元,Factset预期2025年资本开支将达3338亿美元(同比+49%)[1][2] - 云厂商上调2025年资本开支指引:谷歌上调至850亿美元(前值750亿),Meta上调至660-720亿美元(前值640-720亿)[1][2] - 海外CSP资本开支高增有望持续提振算力需求信心,建议关注全球AI算力链(光模块、液冷、铜连接、交换机等)[1][11] 市场表现 - 上周通信(申万)指数上涨2.54%,跑赢上证综指(-0.94%)和深证成指(-1.58%)[1][11] - 通信设备制造子板块周涨幅2.75%,通信运营子板块周涨幅0.50%[5] - 周涨幅前十公司中通信行业占6席,英维克(+29.64%)、长飞光纤(+25.85%)、天孚通信(+25.17%)领涨[9] 重点公司动态 - 天孚通信:1Q25营收9.4亿元(同比+29%),归母净利3.4亿元(同比+21%),目标价119.12元(2025年32xPE)[47] - 星网锐捷:1H25归母净利预增44%-92%,上调2025年盈利预测49%至8.07亿元,目标价35.65元(26xPE)[49] - 锐捷网络:1Q25归母净利同比+4544%至1.07亿元,维持2025年盈利预测7.75亿元,目标价88.70元(65xPE)[50] - 中国移动:1Q25归母净利306.3亿元(同比+3.45%),维持2025年盈利预测1455亿元,目标价126.40元(1.9xPB)[52] 行业热点事件 - 中国联通启动79.6亿元通用服务器集采,国产服务器占比超90%(鲲鹏42.85亿元+海光27.82亿元)[20] - 我国卫星互联网低轨06组卫星成功发射,创"三天两发"组网纪录,GW星座规划12992颗卫星[24] - 中兴通讯展示5G-A极简专网方案,空口时延<10ms,可靠性>99.99%,支持机器人协同作业[18] - 月之暗面发布KimiK2高速版模型,输出速度提升至每秒40Tokens,定价降幅达50%[21]
绿色算力投资手册(上):低碳化与数字化双引擎驱动,绿色算力多维度创新发展
浙商证券· 2025-08-03 12:49
行业投资评级 - 绿色算力行业在"低碳化"与"数字化"双引擎驱动下呈现蓬勃发展态势,被明确视为新质生产力的重要组成部分[1][2] - 行业评级为积极增长型,未来五年全球算力规模预计以超过50%的速度增长,中国近5年平均增速近30%[2] 核心观点 - 绿色算力通过能源侧、算力侧(算法+数据中心)、应用侧三大方向实现全生命周期低碳化[4] - AI算力需求爆发式增长导致能耗激增,2024年AI数据中心IT能耗达55.1TWh,2027年将增至146.2TWh,年复合增长率44.8%[2] - 采用ECCI框架(高效设备+节能载体+清洁算能协同+普惠算用协同)推动技术创新[5] 宏观层面分析 - 全球算力总规模2023年达1369EFLOPS,中国占230EFLOPS,体现显著规模优势[2] - 绿色算力具备全局性(跨体系协同)、先导性(产业赋能)、长期性(系统规划)三大属性特征[3][17] - "杰文斯悖论"现象表明算法效率提升反而刺激更广泛的应用场景和算力需求[2][36] 中观技术路径 - 硬件生命周期(制造+报废)与软件生命周期(开发+部署)构成双维度碳足迹管理框架[4] - 数据中心能耗结构:IT设备占45%(服务器50%+存储35%+网络15%),空调系统占40%[48] - PUE能效指标成为核心标准,全球行业平均PUE从2007年2.5降至2024年1.56,中国目标2060年达1.3以下[12][13] 微观企业实践 - Amazon通过AWS迁移实现计算密集型任务碳排放降低99%,部署500+风光绿电项目[5][7] - Google数据中心实现64%时段零碳运行,北欧园区超90%采用TPU v5e高能效芯片[7] - 腾讯怀来"风光储"微电网年发绿电1400万度,减少8000吨碳排放[8] - 阿里云浸没式液冷技术使PUE降至1.19,华为全光交换技术降低节点功耗至传统方案1/40[8] 政策支持体系 - 中国"东数西算"工程要求枢纽节点数据中心PUE≤1.2,绿电占比超80%[65] - 工信部明确2025年新建大型数据中心PUE目标1.25以下,可再生能源利用率年均增长10%[65] - 建立绿色算力指数体系,覆盖算力生产力、碳效、智能管理等六大类18项指标[66] 市场应用前景 - 金融行业AI渗透率达78%,在智能风控、量化交易等场景形成成熟应用[91] - 生成式AI服务器占比将从2025年29.6%提升至2028年37.7%,市场规模达2227亿美元[77] - 边缘计算推动算力需求泛在化,2030年AI工作负载占比将超IT设备总负载50%[77]
手机芯片:从SoC到Multi Die
半导体行业观察· 2025-07-09 09:26
先进封装技术趋势 - 高端手机市场正采用多芯片组件实现更高性能、灵活性和更快上市时间,而中低端移动设备仍以单片SoC为主[2] - 多芯片方案支持AI推理需求,适应快速变化的AI模型和通信标准,3D/2.5D技术在HPC领域已部署多达12个芯片,但移动领域因成本限制进展较慢[2][5] - 2.5D封装通过中介层连接芯片,具备高效短距离通信优势,允许不同工艺节点(如2nm基础芯片+其他制程AI加速器)混合集成[6][8] 单片SoC的竞争力 - 单片SoC集成微控制器、内存、无线通信等组件,凭借短信号路径实现低功耗和高效率,是物联网设备首选方案[2][3] - 单芯片方案降低客户封装集成成本,Synaptics通过单芯片整合多技术构建竞争优势,而竞品采用多芯片封装伪装单芯片方案[3] 高端移动市场的技术演进 - 高端手机转向2nm GAA工艺,但流片周期长且成本高,多芯片架构可灵活应对参数需求变化(如AI参数从70亿增至140亿)[8] - 3D堆叠支持异构集成(CPU+GPU+专用加速器),UCIe互连实现水平连接,不同工艺节点组合优化性能与成本[5] - 可折叠设备推动模拟/数字芯片分离设计,Synaptics采用RISC-V内核E7处理复杂触摸数据,搭配矢量协处理器提升AI检测精度[10] AI与能效优化 - 手机厂商通过模块化设计(基础芯片+AI加速器)覆盖功能机到高端市场,灵活配置硬件组合[8] - Imagination重构GPU流水线设计,SRAM访问减少50%,两级流水线提升AI处理能效,功耗节省可转化为更高性能或续航[15][16] - 英飞凌28nm eSIM降低功耗,支持无物理切换运营商,提升设计灵活性[16] 通信与内存挑战 - 5G/6G协议兼容性要求芯片高效处理多网络带宽,需专用处理器应对功耗和散热限制[11][12] - LPDDR6/UFS5.0等内存标准迭代推动多芯片方案,避免重复流片成本[11] 行业竞争格局 - 垂直整合厂商可自定义接口实现高度集成,而新进入者聚焦特定用例优化硬件[18] - 苹果、NVIDIA、亚马逊等均在硅片级集成AI硬件,Arm Zen5协调AI加速,移动与超算技术路径趋同[14]
OpenAI转向TPU,这对谷歌、英伟达和亚马逊意味着什么?
华尔街见闻· 2025-07-01 12:35
OpenAI转向谷歌TPU芯片 - OpenAI近期开始租用谷歌的TPU芯片为ChatGPT等产品提供算力支持,这是该公司首次大规模使用非英伟达芯片 [2] - 此次合作使得OpenAI缓解对微软数据中心的依赖,同时为谷歌的TPU提供了挑战英伟达GPU市场主导地位的机会 [2] - OpenAI希望通过谷歌云租用的TPU芯片降低推理计算成本 [2] - 摩根士丹利认为OpenAI是迄今为止最重要的TPU客户,这一协议是对谷歌AI基础设施能力的重要认可 [2] - 谷歌的TPU技术已经发展了十年,最初的TPU于2015年发布 [2] 对谷歌的影响 - 这一合作可能成为谷歌云收入加速增长的驱动因素,而这一点尚未反映在GOOGL股价中 [2] - 反映了谷歌对其在搜索领域地位的信心 [2] - 若OpenAI带动更多客户迁移,GoogleCloud的ComputeTAM有望被快速上修 [3] - 尽管OpenAI无法获得最先进的版本仍选择使用TPU,证明了谷歌在更广泛的ASIC生态系统中的领先地位 [3] - 随着开发者对TPU熟悉度提升,谷歌以外的公司进一步采用TPU可能成为谷歌云业务的额外增长驱动力 [3] - 摩根士丹利芯片模型显示,预计2027年和2028年TPU支出仅为约210亿美元和240亿美元(大部分由谷歌内部使用) [2] 对英伟达的影响 - 英伟达仍将保持GPU市场主导地位 [1] - 摩根士丹利预计英伟达今年在谷歌客户方面的收入将增长超过3倍,达到200多亿美元 [4] - 英伟达处理器份额增长至接近65% [4] - 公司目前处于售罄状态,特别是机架级产品 [5] - 替代架构的需求强劲至少部分由推理短缺驱动,需要紧急解决 [5] 对亚马逊AWS的影响 - OpenAI现在将在大多数主要云服务提供商上运行AI工作负载,而亚马逊AWS明显缺席 [6] - 这可能反映了亚马逊仍然存在比预期更大的产能约束,无法满足OpenAI的需求 [6] - 对AWS的Trainium定制硅芯片构成负面影响,特别是OpenAI选择使用上一代TPU而不是Trainium [6] - 这一动态预计将使投资者高度关注AWS的增长情况以及下半年的预期加速增长 [7]
大摩:OpenAI合作彰显谷歌(GOOGL.US)AI芯片实力
智通财经网· 2025-07-01 11:02
OpenAI与谷歌TPU合作 - OpenAI可能使用谷歌张量处理单元(TPU)执行AI推理工作 标志着对谷歌硬件技术的有力认可 [1] - 这是OpenAI首次以有意义的方式使用非英伟达芯片 尽管无法使用谷歌最强大的TPU 仍选择合作 证明谷歌在ASIC生态系统中的领先地位 [2] - OpenAI过去一直依赖英伟达芯片训练AI模型和进行推理计算 此次合作代表供应商多元化 [1] 合作细节 - OpenAI与谷歌正在敲定协议 将使用谷歌云的计算能力并租用TPU支持推理工作负载 [1] - OpenAI无法使用谷歌最强大的TPU 因为这些TPU已被预留用于训练谷歌自身的Gemini模型 [1] - OpenAI选择使用上一代TPU而不是亚马逊AWS的Trainium芯片 [2] 行业影响 - 此次交易有望推动谷歌云业务快速发展 增强市场对谷歌AI芯片的信心 [1] - OpenAI是迄今为止最引人注目的TPU客户 其他客户包括苹果 Safe Superintelligence和Cohere [2] - 英伟达GPU供应有限可能是OpenAI决定使用谷歌TPU的原因之一 [2] - 对亚马逊AWS及其定制Trainium芯片来说并非好事 [2] - OpenAI将在谷歌云 微软Azure 甲骨文和CoreWeave等大多数主要云服务提供商运行AI工作负载 亚马逊是唯一缺席的重要参与者 [2]