算力短缺
搜索文档
云厂商破天荒涨价,未来一年算力供给会改善吗?| Jinqiu Select
锦秋集· 2026-03-20 23:00
行业核心观点 - 2026年全球云计算行业出现集体涨价,打破了近二十年的降价惯例,主要原因是全球AI需求爆发和核心硬件成本显著上涨 [1] - 云厂商涨价潮的本质是算力正从基础设施转变为稀缺资源,AI创业团队面临算力资源被大规模云服务商锁定、小型团队难以批量获取的局面 [2] - 当前的算力短缺是结构性的产能短缺,而非周期性供需波动,这导致算力从“成本项”转变为关乎产品节奏、商业模式乃至公司生死的“战略资源” [3][4] - 在算力成为战略资源的背景下,能够在正确时间窗口锁定足够算力的公司将在竞争中占据先手,而对供给侧瓶颈缺乏认知则可能在关键增长节点遭遇“有需求、无资源”的困境 [5][6] 云厂商涨价与算力资源现状 - 2026年1月,AWS率先对GPU训练实例上调约15%,谷歌云随即宣布数据传输服务最高涨价100% [1] - 2026年3月,国内云厂商密集跟进:腾讯云率先上调自研大模型价格,涨幅最高达463%;阿里云与百度智能云宣布AI算力及存储产品涨价,最高涨幅34% [1] - 超大规模云服务商的集群资源已被牢牢锁定,小型团队几乎无从批量获取 [2] - 云服务厂商2026年数据中心资本支出预期较一年前大幅增长甚至翻倍,但仍被市场认为“不够用” [2] 算力供给侧的瓶颈分析 - 当前算力瓶颈已彻底进入硅芯片短缺阶段,先进的逻辑和存储器制造能力不足以支撑计算部署的步伐 [19] - 台积电N3逻辑晶圆产能是当前最大的制约因素之一,其产能扩张未能跟上AI需求的激增 [22][37] - 到2026年,所有主流AI加速器系列(包括英伟达、AMD、谷歌TPU、AWS Trainium、Meta MTIA)都将过渡到台积电N3系列工艺节点,AI将成为N3需求的主要来源 [28][29][30][31] - 2026年,人工智能相关应用(加速器、主机CPU和网络N3芯片)的需求将占N3芯片总产量的近60% [45] - 全球内存短缺问题短期内难以缓解,HBM高带宽内存供应紧张是下一个主要制约因素 [61] - HBM消耗的晶圆产能约为普通DRAM的三倍,随着向HBM4过渡,这一差距可能扩大到近四倍,挤占了普通DRAM的产能 [61] - 客户对更高HBM引脚速度(如约11 Gb/s)的需求进一步限制了HBM的有效供应,因为内存厂商难以以可接受的良率大规模交付 [68] - CoWoS先进封装的限制有所缓解,前端晶圆(如N3)供应成为主要瓶颈 [79] - 过去几年,数据中心和电力是主要瓶颈,但当前预测显示电力供应将超过AI计算需求,加速器硅的供应已成为主要制约因素 [81] 供应链竞争与厂商策略 - 在N3晶圆产能争夺中,人工智能基础设施客户的优先级明显高于消费电子产品客户,因为AI加速器设计带来更高的平均售价,且AI驱动的需求是台积电增长的主要动力 [51] - 由于需求远超供应,预计到2026年下半年,台积电N3工艺的有效利用率将超过100% [52] - 台积电受到洁净室空间的限制,未来两年内无法新增足够产能来完全满足市场需求 [52] - 产能限制可能促使客户寻求更广泛的晶圆代工模式,例如转向英特尔或三星晶圆代工 [40] - 英伟达在供应链控制上准备最充分,其通过提前锁定大部分逻辑晶圆、内存等组件供应成为主要受益者,例如2025年的韩国之行旨在确保内存供应 [85] - 最终能够获得最多硅供应的供应商将占据最大的计算部署份额 [85] 潜在的需求转移与产能再分配 - 智能手机是2026年N3晶圆需求的第二大驱动力,但也可能成为需求疲软的领域,从而释放产能用于AI加速器 [58] - 智能手机需求预期可能被下调至同比两位数的低位下滑 [58] - 如果将2026年智能手机N3晶圆总开工量的5%(43.7万片晶圆的5%)重新分配给AI加速器,则可额外生产约10万颗Rubin GPU或约30万颗TPU v7 [58] - 在更极端情况下,如果将25%的智能手机N3晶圆重新分配,则可额外生产约70万颗Rubin GPU或约150万颗TPU v7 [58] - 在消费级设备出货量下降的背景下,部分内存可能从消费级应用重新分配到服务器和HBM [76] - 在消费级内存出货量下滑10-15%的基本预测下,释放的容量增量(约占DRAM总需求的3%)不足以实质性改变整体供需格局 [78] 市场需求与增长数据 - Token需求呈爆炸式增长,推动了对人工智能计算的持续加速需求 [16] - 仅在2026年2月,Anthropic就新增了高达60亿美元的年度经常性收入,主要得益于智能体编码平台Claude Code的广泛应用 [16] - 超大规模云服务提供商的资本支出计划大幅调整,其中谷歌2026年的资本支出预期几乎是此前预期的两倍 [17] - 从H100到Rubin,以及从MI300到MI400等,AI加速器的HBM容量在快速提升(如提升50%甚至4倍),驱动了HBM位出货量的急剧变化 [66] - NVIDIA下一代平台的AI服务器系统内存将大幅增长,VR NVL72机架的DDR内存容量将是Grace的三倍 [71] - 2026年DRAM的整体位需求预计将出现增长,同时AI工作负载正在推动CPU需求,并逐步提高CPU与GPU的比例 [71]
Manus季逸超首次公开回应邀请码争议:因全球算力短缺,“Claude说千万别放开,会挂”
新浪财经· 2026-01-04 17:26
公司战略与运营 - Manus公司内部设定了一个关键的财务里程碑,即年度经常性收入达到1亿美元,作为其对外公开回应特定问题的前提条件[1][2] - 公司在产品上线前就已决定采用邀请码机制,其根本原因在于全球范围内能够快速部署的即时算力供应严重不足,所有合作的云厂商和模型推理服务商均无法满足其潜在的需求量[1][2] - 公司采用邀请码机制的核心目的是进行流量控制,以避免服务因需求过载而崩溃,这一决策直接源于其关键合作伙伴Claude的明确警告[1][2] - 公司承认邀请码机制并非最理想的用户获取方案,存在其他更优选择,例如不设置明确代码的定向邀请,但公司在决策初期并未深入考虑这些替代方案[1][2] 行业生态与供应链 - 全球AI算力基础设施,特别是能够实现“第二天立即到位”的即时推理算力,其实际可用规模远低于行业预期,存在显著的供应瓶颈[1][2] - 主要的云服务提供商和AI模型推理服务商普遍面临算力资源紧张的问题,无法灵活、快速地响应客户突增的大规模算力需求[1][2] - 算力供应紧张的状况已经对下游AI应用公司的产品发布和运营策略产生了直接影响,迫使它们采取限制用户增长的保守策略[1][2]
算力短缺“卡脖子”!谷歌狂砸AI基建,4-5年冲刺千倍增长
搜狐财经· 2025-11-22 14:21
公司AI基础设施扩张计划 - 谷歌云计划每6个月将基础设施服务能力翻倍,目标在4-5年内实现1000倍增长 [1] - 公司正加码AI基建投入,已公开能效较初代提升30倍的第七代TPU芯片"Ironwood" [3] - Alphabet公司年内第二次上调资本支出预期至910-930亿美元,并预计2026年还将"大幅增加" [3] 行业竞争格局与公司策略 - 微软、亚马逊、Meta同期总资本支出预计超过3800亿美元,AI基建竞赛进入白热化阶段 [3] - 谷歌核心目标是打造更可靠、高效的基础设施,而非单纯比拼投入规模 [3] - 公司探索将物理数据中心客户转向云服务,以提升资源利用率 [3] 业务表现与投资逻辑 - 谷歌云业务季度营收增长34%,订单总额达到1550亿美元 [3] - 公司CEO强调"投资不足风险更高",并认为公司财务实力足以应对市场波动 [3] - 算力短缺已成为发展瓶颈,例如视频生成工具Veo因算力限制无法向更多用户开放 [3]
微软CTO:希望未来主要采用自研AI数据中心芯片,自主设计数据中心系统
美股IPO· 2025-10-02 11:53
微软自研芯片战略 - 公司未来目标是让数据中心主要使用自研芯片,以减少对英伟达和AMD等供应商的依赖 [1][3][6] - 公司致力于从芯片到冷却系统的整体数据中心系统设计,以实现计算资源与工作负载的高度匹配 [1][7] - 公司已推出专为AI工作负载打造的Azure Maia AI加速器芯片和Cobalt CPU,并已在大量使用 [5][6] 行业竞争格局 - 包括微软、谷歌和亚马逊在内的主要云计算公司都在为数据中心设计自研定制芯片,以提高效率并满足特定需求 [4][7] - 英伟达目前在AI GPU领域占据主导地位,其解决方案长期以来被视为性价比最佳的选择 [3][4][5] - 科技巨头(如Meta、亚马逊、Alphabet和微软)今年已承诺超过3000亿美元的资本支出,大部分投向人工智能领域 [8] 市场需求与产能挑战 - 行业目前存在严重的算力短缺问题,自ChatGPT上线以来一直处于难以快速扩充产能的状态 [9] - 公司通过建设数据中心扩大产能,但即便最激进的预测也常常被证明不足以满足需求 [9][10] - 公司过去一年部署了惊人的计算资源,并计划在未来几年部署更多 [10]
“星际之门”在美国“新开5个数据中心”,投资额高达4000亿美元,目标“三年建成,7GW”
华尔街见闻· 2025-09-24 12:27
项目概况与规模 - OpenAI、甲骨文和软银宣布在美国新增五个“星际之门”项目站点,选址包括德克萨斯州、新墨西哥州、俄亥俄州及一个未披露的中西部地点[1] - 连同德克萨斯州阿比林旗舰站点及与CoreWeave的合作项目,星际之门项目有望在未来三年投资4000亿美元,最终达到7吉瓦容量[2] - 德州阿比林旗舰站点已投入运营,配备了甲骨文云基础设施和英伟达芯片机架,该园区最终容量有望扩展至超过1吉瓦,足以为约75万个美国家庭供电[2] 甲骨文的核心角色与建设规模 - 甲骨文在扩张计划中扮演核心角色,OpenAI与甲骨文达成协议,将在未来五年合作开发高达4.5吉瓦的新增容量,合作价值超过3000亿美元[5] - 新增容量主要来自三个新站点:德克萨斯州沙克尔福德县、新墨西哥州多尼亚安娜县以及一个即将公布的中西部站点[5] - 公司正以前所未有的速度扩张其云基础设施版图,以满足巨大的AI训练和推理需求[6] - 人类历史上从未有人以如此快的速度建造数据中心,当前建设是为了确保2026年能采用英伟达下一代Vera Rubin芯片的算力上线[9] 项目背景与战略意图 - 项目建设是为了应对大规模的算力紧缺,确保有足够算力完成AI能够做到的所有事情[8] - OpenAI CEO表示,项目旨在扭转其他国家以更快速度建设芯片工厂和新能源生产设施的趋势[3] - “星际之门”未来将成为OpenAI所有基础设施项目的代号,项目进度已领先于原定计划[10] 融资模式与财务状况 - 支撑庞大建设计划的是一个复杂的资金网络,甲骨文等公司帮助建设提供资金,但OpenAI最终将以运营费用形式为算力付费[12] - OpenAI今年营收预计将达到130亿美元,公司计划利用自身现金流和债务融资来支付建设费用[13] - 英伟达通过股权投资启动项目,并将为其部署的所有GPU获得报酬[15] - 这种融资模式被外界质疑为“循环融资”,即供应商直接投资于项目,而项目本身又是为了购买该供应商的产品[16] 政治与经济影响 - 项目带有显著政治色彩,OpenAI和甲骨文最早于今年1月在白宫与美国总统特朗普共同公布此项目,Friar称特朗普为“这个AI时代的总统”[19][20] - 从经济影响看,甲骨文表示该项目每天将雇用超过6000名建筑工人,并提供近1700个长期工作岗位[21] - OpenAI指出其数据中心建设有助于通过新技术重塑美国电网,并帮助美国发挥全球影响力,表明其愿景已超越技术本身,意图在全球格局中扮演更重要角色[22][23]
三大期指齐跌,芯片股多数上涨;Meta冻结AI岗位招聘;强生公司将在美投资20亿美元以应对药品关税【美股盘前】
每日经济新闻· 2025-08-21 21:47
美股期指表现 - 道指期货下跌0.23%,标普500指数期货下跌0.09%,纳斯达克指数期货下跌0.02% [1] 中概股及特定公司动态 - 中概股多数上涨,其中小鹏汽车上涨1.08%,蔚来汽车上涨2.95%,Boss直聘上涨3.26%,名创优品上涨5.56% [2] - 塔吉特公司首席执行官布莱恩·康奈尔将于明年2月1日卸任,由首席运营官迈克尔·菲德尔克接任,公司在过去11个季度中有9个季度销售额持平或下降,股价下跌0.37% [2] - 芯片股多数上涨,英伟达上涨0.4%,AMD上涨0.72%,台积电上涨0.32%,OpenAI首席财务官表示公司仍面临算力短缺,对GPU需求很大 [2] 企业战略与运营调整 - Meta公司已暂停其AI部门招聘,此前招聘了50多名研究人员和工程师,有分析警告其与谷歌为吸引AI人才提供的股票薪酬可能威胁股票回购能力,股价下跌0.21% [3] - 诺和诺德公司已对全球范围内的非关键职位实施招聘冻结,并考虑在未来裁员以节约成本,股价上涨0.24% [3] - 强生公司承诺投资20亿美元在美国北卡罗来纳州建造新工厂以扩大生产业务,有分析称此举旨在规避潜在的药品进口关税,股价下跌0.29% [4] 航空业事件 - 达美航空一架波音737客机在飞行中出现机翼受损,机上载有62名乘客和6名机组人员,无人受伤,飞机已停飞维修,美国联邦航空局正进行调查,达美航空股价下跌0.08%,波音公司股价下跌0.27% [3]