算法革新

搜索文档
摩根大通专家访谈:AI数据中心“产能过剩”了吗?训练和推理基建如何部署?
硬AI· 2025-06-19 23:49
算法革新 - 近期算法突破如混合模型、精度训练及策略性强化学习显著降低AI模型训练所需计算量 行业优化重点转向推理环节 [4] - 业界采用模型蒸馏、压缩等技术精炼模型 力求在不大幅增加原始算力投入前提下提升性能 [4] 基础设施 - AI基础设施部署仍处早期阶段 云服务商对投资长期回报预期较高 当前对产能过剩担忧有限 [6] - 训练集群在新一代GPU推出后被快速重新配置为推理工作负载 实现"训练转推理"生命周期转换 [7] - 训练集群部署在新建隔离设施("绿场") 推理集群通过扩建现有数据中心("棕地") 尤其在大都市区 [7] 能源挑战 - 电力供应和散热问题成为下一代数据中心规模扩展的主要瓶颈 [9] - 超大规模企业探索液冷技术、核能或替代能源以实现7x24小时稳定供电 电网互联策略对保障不间断运行至关重要 [9] 数据中心架构创新 - Meta采用专门针对内部AI工作负载的I型校园式配置 在功耗、冷却和机架密度方面实现改进 [11] - Meta平衡品牌解决方案与白盒方案 网络方面与Celestica等白盒供应商合作 长期目标将内部软件与白盒硬件集成 [12]