Workflow
2025中国AI算力大会:系统级集成崛起,AI基础设施进入软硬协同新阶段
海通国际证券·2025-07-01 18:35

报告行业投资评级 未提及 报告的核心观点 - 2025年6月26日北京举办的“2025中国AI算力大会”是国产AI基础设施转型升级重要节点,AI算力迈入“系统级融合”新时代,万卡集群部署与软硬一体化架构成主流技术演进方向 [1][15] - 国产AI集群时代全面开启,AI系统从卡级优化升级为集群级调度,传统单卡性能优化方式让位于对万卡级训练集群等全面要求 [2][16] - 新时代AI基础设施注重系统效率重构,TPU国产替代加速落地,中昊芯英自主设计量产国产TPU芯片,实测性能接近国际主流水平,支持千卡级集群训练,掌握全流程能力 [2][17] - 大会反映技术变革,AI产业链重构核心逻辑从模型跃迁走向基础设施跃迁,系统级能力决定未来竞争格局,国产+系统是双重机会窗口,AI基础设施成为To B创新催化器 [3][18] 根据相关目录分别进行总结 技术发展趋势 - 低精度浮点计算标准化,摩尔线程实现FP8精度支持,提升训练效率、降低功耗,成万卡集群落地标配能力 [5][19] - 从HPC到AI Cloud Infra,AI训练向混合异构系统发展,推动传统HPC架构全面云化,强化调度系统与任务稳定性设计,形成AI智能云雏形 [5][19] - 散热能力进化关键,液冷突破物理瓶颈,传统风冷热流密度极限约<90W/cm²,单相液冷可提升至~200W/cm²,相变液冷热流密度上限>500W/cm²,是支撑千卡级/万卡级AI集群系统关键技术突破口 [5][19] - AI Agent为代表的AI原生业务登场,Agent将成企业服务等场景新中枢,倒逼算力平台支持更强多模型并行、多租户任务调度能力 [5][19] 大模型训练时间对比 | 模型 | 计算量 (FLOPs) | 千卡集群MFU: 40% / 60% | 五千卡集群MFU: 35% / 55% | 万卡集群MFU: 30% / 50% | | --- | --- | --- | --- | --- | | DeepSeek - V3 | 3.4 E+24 | 97天 | 22天 | 13天 | | Qwen3 - 235B - A22B | 4.75 E+24 | 136天 | 31天 | 18天 | | Llama 3.3 70B | 6.9 E+24 | 132天 | 29天 | 16天 | | Llama 2 708 | 8.1 E+23 | 15.5天 | 3.4天 | 1.9天 | | GPT - 4 | 2.1 E+25 | 602天 | 137天 | 80天 | | GPT - 3 | 3.14 E+23 | 6天 | 1.3天 | 0.7天 | [13]