Workflow
中金 | AI进化论(13):算力,后GPT-5时代的“硬通货”
中金点睛·2025-08-13 07:49

全球大模型发展态势 - 2Q25全球大模型厂商加速推出更强能力产品,算力需求持续提升[2] - 3Q25随着GPT-5问世,全球大模型进入密集发布期,市场情绪升温[2] - 2025年上半年全球9家主要公司发布21个模型,同比分别增长28.6%和10.5%[24] GPT-5技术突破与商业策略 - GPT-5实现Token效率提升50–80%,API调用价格对标Gemini 2.5 Pro[13][14] - 定价策略显著降本:输入Token收费1.25美元/百万,输出10美元/百万[15] - 上下文窗口扩展至400K Tokens,较GPT-4o提升3.1倍[22] - OpenAI计划5个月内将算力资源翻倍,侧重推理侧分配[25] 海外算力需求驱动因素 - 谷歌AI Overview功能驱动Token消耗量达微软5–6倍[31] - 谷歌AI Overview月活15亿,Gemini月活3.5亿,ChatGPT月活6亿[31] - 免费模式主导市场,付费产品通过差异化能力实现商业闭环[34] 国内大模型进展 - 字节豆包大模型日均Token使用量达16.4万亿,国内公有云市场份额46.4%[41] - Kimi K2采用万亿参数MoE架构,每百万输入Token定价4元[36] - MiniMax模型单任务Token消耗成十倍增长,快手可灵AI全球用户突破2200万[38][41] 国产算力供应链升级 - 国产AI芯片厂商聚焦互连技术与超节点架构,提供全维度算力支撑[44] - 算力瓶颈从解码能力转向带宽与互联能力受限[42] 模型迭代与算力关联 - 模型能力增强伴随Token效率提升,推高云侧与端侧算力需求[22] - 多模态、长上下文等能力拓展直接增加算力消耗[24][36]