Workflow
从Token角度,测算AI算力需求
华泰证券·2025-07-01 16:26

报告行业投资评级 - 科技行业投资评级为增持(维持)[5] - 计算机行业投资评级为增持(维持)[5] 报告的核心观点 - 推理算力需求增长速度快于单位算力成本的降低,持续看好推理端算力需求的加速增长[1][36] 根据相关目录分别进行总结 海内外大厂Token调用量增长迅速,推理算力需求加速放量 - 海外CSP厂商中,Google的Token月均调用量从24年4月的9.7万亿增长至25年4月的480万亿,增长50倍;Azure AI基础设施25年一季度处理超100万亿Token,较去年同期增长5倍,3月单月Token调用量达50万亿[2] - 国内互联网大厂中,25年5月字节火山引擎Token日均调用量为16.4万亿,是24年5月的137倍,AI工具类Token消耗快速增长,新场景实现日均百亿Token突破[12] 北美大厂Token调用量与算力需求测算 Google Token调用量与算力需求测算 - Google Token调用量增长主要源于AI搜索的拓展,25年5月和6月推理Token量将分别达到659/870万亿,环比增长37%/32%,二季度Token总量将达2009万亿,环比增长223%,较24Q2增长接近30倍[20] - Google推理Token主要包含AI搜索、Gemini 2C应用和其他推理需求三部分,AI搜索渗透率、AI Mode占比、Gemini Agent占比的增长将带动Token调用量快速增加[20][23] Google Token量快速增长有望带来资本开支持续高增 - 预计Google二季度推理算力需求环比+223%,总算力需求较一季度环比增长223%,推理算力资本开支环比+159%,主要因Token量大幅增长[24][25] - 单位算力成本呈下跌趋势,4/5/6月分别环比下降14%/13%/13%,影响因素主要有新款芯片迭代和算法迭代[26] 微软Token调用量与算力需求测算 - OpenAI Token调用量的提升主要源于ChatGPT网页访问量上升及Deep Research功能的渗透,预计25年第二季度微软总Token调用量有望达205万亿,环比增长约100%[29][32] 微软算力需求测算:年底等效H100芯片需求约为25年3月的两倍有余 - 预计微软二季度推理算力需求环比增长99%,2025年3月整体推理算力需求为15.3 Trillion TFLOPs,二季度总算力需求为65.6 Trillion TFLOPs[33] - 测算微软年底的推理算力卡需求量约为3月的两倍有余,2025年3月等效H100算力需求为4.3万张,未来月同比增速约为10%[33] 结论:推理算力需求增长速度快于单位算力成本的降低 - 算力支出受算力需求和算力成本影响,AI应用用户数量增长及Agent渗透驱动算力需求上升,硬件迭代与算法改进驱动推理成本下降,市场对整体算力支出存在分歧[35] - 测算推理算力需求增长速度快于单位算力成本的降低,未来算力支出将持续增长,看好推理端算力需求的加速增长[36]