AI大模型训练

搜索文档
提升大模型通信性能30% DeepSeek致谢腾讯大模型网络提速技术方案贡献
深圳商报· 2025-05-12 06:32
腾讯技术优化DeepEP通信框架 - 腾讯技术团队对DeepSeek开源的DeepEP通信框架进行深度优化 在RoCE网络环境性能提升100% 在IB网络环境提升30% [2] - 优化后的技术方案获得DeepSeek公开致谢 被称为"huge speedup"代码贡献 [2] - 该技术已应用于腾讯混元大模型等项目的训练推理 在腾讯星脉与H20服务器构建的高性能环境中展现卓越通用性 [3] DeepEP通信框架原始性能 - DeepSeek开源DeepEP在内的五大代码库 展示如何利用有限硬件资源实现接近万卡集群性能 [2] - DeepEP凭借突破性方法提升300%通信效率 成功解决MoE架构大模型对英伟达NCCL的依赖问题 [2] - 原始技术在RoCE网络环境中表现不佳 限制了更广泛场景的应用 [2] 腾讯优化关键技术突破 - 通过拓扑感知的多QP建链技术 智能分配数据流 优化双端口网卡带宽利用率 避免带宽浪费 [3] - 基于IBGDA技术优化 解决GPU通信中CPU控制瓶颈问题 降低延迟和能耗 [3] - 提出"QP内时序锁"机制 使多个GPU间数据传输能精准按顺序完成 即使同时处理1000多个任务也能自动理顺顺序 [3] 技术应用与行业影响 - 腾讯优化使DeepEP在RoCE网络性能翻倍 反哺IB网络时通信效率再提升30% [3] - 该技术已全面开源 为AI大模型训练提供更高效解决方案 [2][3]
DeepSeek致谢腾讯技术团队:对DeepEP的优化,是一次“huge speedup”代码贡献
新浪科技· 2025-05-07 19:12
技术优化 - 腾讯技术团队对DeepSeek开源的DeepEP通信框架进行深度优化,在RoCE网络环境性能提升100%,IB网络环境提升30% [1] - 优化后的技术方案获得DeepSeek公开致谢,被称为"huge speedup"代码贡献 [1] - 腾讯星脉网络团队发现DeepEP两大关键瓶颈:双端口网卡带宽利用率不足和CPU控制面交互时延 [2] - 技术优化后,DeepEP在RoCE网络实现性能翻倍,IB网络通信效率提升30% [2] 技术突破 - DeepSeek开源的DeepEP通信框架通过突破性方法提升300%通信效率,减少对英伟达NCCL的依赖 [2] - 优化措施包括:替换IBRC为IBGDA、为每个通道使用独立QP实现并行数据传输 [1] - 优化后internode带宽达到58GB/s(RDMA),internade带宽达到51GB/s(RDMA) [1] 应用与影响 - 该技术已全面开源并应用于腾讯混元大模型等项目的训练推理 [2] - 在腾讯星脉与H20服务器构建的高性能环境中展现出出色通用性 [2] - 技术优化使企业AI大模型训练获得更高效解决方案 [1]
技术驱动与绿色转型双轮并进,润泽科技一季报稳健增长
证券时报网· 2025-04-29 12:08
财务表现 - 一季度营收11.98亿元,归属于上市公司股东的净利润4.3亿元,财务指标健康 [1] 业务发展 - 作为国内领先的智算基础设施提供商,以技术创新与绿色发展为双引擎,加速构建面向未来的算力底座 [1] - 已形成覆盖京津冀、长三角、粤港澳大湾区等核心经济带的7大AIDC智算集群 [1] - 已交付及即将交付的算力中心全部取得投产订单,预计2025年可完成上架并趋向成熟 [1] 技术布局 - 持续深化液冷技术商业化落地,2023年交付业内首例整栋纯液冷绿色智算中心 [1] - 液冷智算中心PUE已降至1.15左右,廊坊园区已交付的智算中心实际运行PUE达到行业领先水平 [1] - 液冷领域的先发优势将转化为市场壁垒,为AI大模型训练提供高可靠、高效能的算力基础设施支撑 [1] 绿色低碳战略 - A-7、A-18算力中心凭借卓越的节能降耗表现,成功入选国家绿色数据中心 [2] - 2024年完成绿电交易总量8亿千瓦时,持续深耕节能技术研发,推动绿色低碳转型 [2] 海南自贸港战略布局 - 在海南儋州建设智算基础设施集群,规划约3万架机柜,完善跨境布局 [3] - 依托海南跨境电商综合试验区政策红利,为跨境电商、跨境支付等场景提供稳定、安全、可靠、绿色的服务 [3] - 契合《海南自由贸易港建设总体方案》中"数字经济发展"导向,为开拓境外市场奠定基础 [3]