2025中国AI算力大会：系统级集成崛起，AI基础设施进入软硬协同新阶段

报告行业投资评级未提及报告的核心观点 - 2025年6月26日北京举办的“2025中国AI算力大会”是国产AI基础设施转型升级重要节点，AI算力迈入“系统级融合”新时代，万卡集群部署与软硬一体化架构成主流技术演进方向 [1][15] - 国产AI集群时代全面开启，AI系统从卡级优化升级为集群级调度，传统单卡性能优化方式让位于对万卡级训练集群等全面要求 [2][16] - 新时代AI基础设施注重系统效率重构，TPU国产替代加速落地，中昊芯英自主设计量产国产TPU芯片，实测性能接近国际主流水平，支持千卡级集群训练，掌握全流程能力 [2][17] - 大会反映技术变革，AI产业链重构核心逻辑从模型跃迁走向基础设施跃迁，系统级能力决定未来竞争格局，国产+系统是双重机会窗口，AI基础设施成为To B创新催化器 [3][18] 根据相关目录分别进行总结技术发展趋势 - 低精度浮点计算标准化，摩尔线程实现FP8精度支持，提升训练效率、降低功耗，成万卡集群落地标配能力 [5][19] - 从HPC到AI Cloud Infra，AI训练向混合异构系统发展，推动传统HPC架构全面云化，强化调度系统与任务稳定性设计，形成AI智能云雏形 [5][19] - 散热能力进化关键，液冷突破物理瓶颈，传统风冷热流密度极限约<90W/cm²，单相液冷可提升至~200W/cm²，相变液冷热流密度上限>500W/cm²，是支撑千卡级/万卡级AI集群系统关键技术突破口 [5][19] - AI Agent为代表的AI原生业务登场，Agent将成企业服务等场景新中枢，倒逼算力平台支持更强多模型并行、多租户任务调度能力 [5][19] 大模型训练时间对比 | 模型 | 计算量 (FLOPs) | 千卡集群MFU: 40% / 60% | 五千卡集群MFU: 35% / 55% | 万卡集群MFU: 30% / 50% | | --- | --- | --- | --- | --- | | DeepSeek - V3 | 3.4 E+24 | 97天 | 22天 | 13天 | | Qwen3 - 235B - A22B | 4.75 E+24 | 136天 | 31天 | 18天 | | Llama 3.3 70B | 6.9 E+24 | 132天 | 29天 | 16天 | | Llama 2 708 | 8.1 E+23 | 15.5天 | 3.4天 | 1.9天 | | GPT - 4 | 2.1 E+25 | 602天 | 137天 | 80天 | | GPT - 3 | 3.14 E+23 | 6天 | 1.3天 | 0.7天 | [13]