Workflow
AI算力需求:预期差在哪里?
2025-06-06 10:37

纪要涉及的行业 AI行业 纪要提到的核心观点和论据 市场预期与需求 - 国内外预期差异:美国西部对AI产业乐观,东部投资者保守,中国投资者更悲观,国内市场对AI算力需求预期未达拐点,预计2025年下半年出现[2] - 2025年下半年需求拐点:训练和推理需求量预计上升,预训练环节将重新活跃,OpenAI新卡到位等因素推动预训练算力需求增加,AI agent应用场景扩大推动推理需求增长[3] - 市场跟踪误区:市场认为训练需求见顶、推理需求缺乏爆款应用无法提升,但实际需求远超预期,懂大模型开发企业感受算力不足[5] - 市场预期分歧原因:2024年AI模型见顶、2025年1月底DeepSpeed推出降低需求、缺乏爆款应用,限制全球算力需求预期并导致价格波动[18] 海外与国内发展趋势 - 海外集中推动算力链:应用领域分散,不易配套具体方案;国内跟随海外涨势,但内部讨论有分歧,海外大模型开发企业计算能力不足,应用和基础设施建设有潜在增长空间[6] - 海外推理需求上升:2025年3月海外投片量显著增长,TOKEN量增加表明推理需求上升,国内市场反应不明显[15] 股市表现与AI发展 - 股市未完全反映真实状况:股价已上涨,但市场预期未完全转变,市场预期拐点来临时股价可能已处高位,需关注新叙事逻辑[7] AI算力需求逻辑分化 - 海外AI应用创新高有分化:收入增速加速的公司如Palantir、Duolingo、SAP股价创新高,无收入加速的公司如ServiceNow、Salesforce未创新高,2025年AI应用叙事逻辑围绕收入加速展开[9] - 公司股价表现分化:英伟达、博通等公司股价创新高或接近新高,Intel、高通等公司表现较弱,市场对AI算力需求预期逐步修复[10] 全球大模型厂商分层及影响 - 厂商分层:微软和Meta专注模型应用;OpenAI和XAI专注推理算力需求;Anthropic和谷歌致力于推动下一代模型迭代路径[1] - 分层对算力需求判断影响:传统通过大厂资本开支判断算力需求趋势,OpenAI和Grok崛起使传统公司算力需求代表性下降,应重点关注OpenAI和Grok资本开支[31] 算力投入与企业策略 - 大规模算力投入重要但有挑战:OpenAI计划建设40万张卡集群、马斯克计划建成100万张卡集群,但成本高昂且效果不确定,训练出的大模型可能需降维处理[27] - 美股四大云厂商跟随策略:大规模算力投入成本巨大、风险高,实际应用价值有限,等待OpenAI等公司探索路径后迭代以降低风险和成本[28] - 中国互联网企业跟随策略:缺乏计算资源和资金支持,难以承担大规模投入,等待其他公司探索路径后迭代以降低风险和资本开支压力[30] 推理与训练算力需求判断 - 分别判断:不能通过推理公司预测训练需求,也不能通过训练公司预测推理需求,推理关注谷歌、微软等,训练关注NVIDIA,大集群建设集中在头部公司[32] - 推理需求上升判断:关注图灵量数据,许多互联网大厂购置GPU卡用于推理,如字节跳动TOKEN消耗量增长[41] AI agent对算力需求 - 需求远高于传统chatbot:约两个数量级,执行任务复杂度和时长增加,应用场景扩大推动推理需求增长,发展节奏加快[38] 美股走势与AI发展 - 近期走势与AI趋势逻辑:美股近期反弹强劲,但全球AI趋势逻辑未变,需新的AI叙事逻辑,否则上涨会增加季报压力[45] - 未来走势与AI发展关系:美股未来走势与AI发展密切相关,缺乏新叙事逻辑继续上涨将面临季报压力,需关注新技术和市场情绪[46] 其他重要但是可能被忽略的内容 - **判断推理需求上升可关注图灵量数据,字节跳动2024年12月日均TOKEN消耗量达4万亿,预计下周大会披露更多推理能力和需求增长数据[41] - **谷歌2025年4月每天产生约16万亿个Token,2024年12月与当时字节跳动数据相近,目前字节跳动每日Token量可能达十几万亿个[42] - **互联网大厂购置计算芯片大部分用于推理,谷歌推理需求占比超90%[43] - **投资者下半年需关注美股估值压力、宏观变量影响、大模型迭代路径进展、海外市场对国内隐性影响,提前跟踪大模型进展避免错过最佳配置时机[51]