负载均衡

搜索文档
腾讯申请负载均衡方法及装置设备存储介质专利,实现业务多可用区多集群部署下多可用区均衡多集群容量均衡目标
金融界· 2025-07-15 12:41
腾讯科技专利技术 - 公司申请了一项名为"一种负载均衡的方法、装置、设备和存储介质"的专利,公开号CN120315850A,申请日期为2024年01月 [1] - 专利涉及数据处理技术领域,旨在实现业务在多可用区、多集群部署下的均衡目标 [1] - 方法包括确定副本数量均衡性、计算迁出副本数、选择目标缩容集群和目标扩容集群,最终完成副本迁移 [1] 公司基本信息 - 腾讯科技(深圳)有限公司成立于2000年,位于深圳市,主要从事软件和信息技术服务业 [2] - 企业注册资本为200万美元 [2] - 公司对外投资了15家企业,参与招投标项目260次 [2] 知识产权与行政资质 - 公司拥有商标信息5000条,专利信息5000条 [2] - 公司持有行政许可472个 [2]
3个中国程序员 vs 3个美国程序员,不得不承认,差距太大了!
猿大侠· 2025-06-27 22:57
公司发展历程 - 2009年曾有团队构想照片分享网站InstantPost 但执行力不足导致项目搁浅 [1][2][3] - Instagram在2010年10月至2011年12月实现用户从0到1400万的增长 验证同类模式的可行性 [6] - Instagram初期由三名程序员开发 采用Objective-C和UIKit技术 早于Swift语言发布 [11][12] 技术架构设计 - 架构准则:保持简单 使用已验证技术 避免重复造轮子 [9] - 早期部署于AWS云服务 包括EC2 Ubuntu Linux 11.04和Elastic Load Balancer [7][15] - 应用服务器采用25+台亚马逊虚拟机 支持无状态扩展 部署工具Fabric实现秒级代码更新 [19][20] 数据存储方案 - 主数据库使用PostgreSQL 存储用户及照片元数据 通过逻辑分片映射物理分片实现扩展 [21][22][24] - 独创64位Photo ID生成算法:41位毫秒时间+13位分片ID+10位序列号 支持高效排序 [26][27] - 照片存储依赖Amazon S3和CloudFront CDN 处理3亿张照片映射 Redis优化后内存占用从21GB降至5GB [28][29][30] 运维与扩展能力 - 负载均衡从DNS轮询升级为Amazon ELB 支持3个NGINX实例热切换 [14][15] - 异步任务通过Gearman队列处理 配备200个Python Workers 推送服务pyapns累计处理10亿条通知 [34][36] - 监控体系整合Sentry Munin Pingdom PagerDuty 覆盖应用错误 系统指标及外部服务状态 [39][40][41] 行业环境对比 - 2009年中国云计算基础设施薄弱 行业领袖对云计算前景持保守态度 [46] - 早期团队缺乏互联网技术实战经验 如负载均衡 分库分表等技术未规模化应用 [43][44] - 智能手机普及度不足 国内测试设备依赖诺基亚机型 与iPhone生态存在代差 [45]
专家一半时间在摸鱼?Adaptive Pipe & EDPB让昇腾MoE训练效率提升70%
雷峰网· 2025-06-03 15:17
MoE模型训练效率挑战 - 混合专家(MoE)模型通过动态路由机制分配token给不同专家网络,实现参数规模化扩展和复杂任务处理优势[2] - 分布式训练中存在两大效率瓶颈:1)专家并行引入计算与通信等待,导致50%以上训练时间浪费在空闲等待[3][4];2)负载不均导致热专家过载而冷专家闲置[4] - 问题类比为城市交通拥堵:1)人车混行阻塞(计算等待通信);2)车道分配僵化(静态专家分配)[4] AutoDeploy仿真平台 - 基于昇腾硬件的数字孪生平台,通过三维建模和高精度硬件映射,1小时内模拟百万次训练场景,实现90%精度的最优并行策略自动选择[8] - 针对Pangu Ultra MoE 718B模型,自动求解出TP8/PP16/VPP2/EP32并行方案,平衡计算/通信/内存[8] Adaptive Pipe通信优化 - 采用层次化All-to-All通信:分机器间数据收集和机器内高速交换两步,相比传统All-to-All加速1倍[10] - 自适应细粒度调度将流水线并行内存占用减半,实现98%以上EP通信掩盖,计算几乎不受通信等待束缚[11] EDPB负载均衡技术 - 专家预测动态迁移(E):通过多目标优化实现专家跨设备智能流动,具备预测先行/双层优化/智能触发三大特性[17] - 数据重排(D)和虚拟流水线均衡(P)分别解决Attention计算不均和混合结构层间等待问题[19] - 整体在最优并行基础上带来25.5%吞吐提升[14] 系统综合收益 - 在Pangu Ultra MoE 718B模型8K序列训练中,Adaptive Pipe单独提升37.5%,EDPB再提升25.5%,端到端总吞吐提升达72.6%[22][23] - 方案类比为智慧交通系统:通信掩盖相当于行人地下通道,动态迁移相当于智能可变车道[22]
国电通申请基于负载均衡的与外部系统统一数据交互的装置专利,提高了系统的资源利用率
金融界· 2025-04-29 11:13
文章核心观点 北京国电通网络技术有限公司和国网信息通信产业集团有限公司于2024年12月申请“一种基于负载均衡的与外部系统统一数据交互的装置”专利,该装置可实现数据高效交互、容错和管理,适用于复杂业务场景,同时介绍了两家公司的基本信息[1][2] 专利信息 - 北京国电通网络技术有限公司和国网信息通信产业集团有限公司申请“一种基于负载均衡的与外部系统统一数据交互的装置”专利,公开号CN119892740A,申请日期为2024年12月 [1] - 该装置包括数据交互服务管理模块、定时器模块、业务优先级调整模块、数据处理模块和数据重置模块,通过智能负载均衡算法动态调整扫描频率和任务优先级,结合数据处理与重置模块实现数据高效交互、容错和管理,提高系统资源利用率、任务处理效率及稳定性,适用于复杂业务场景 [1] 北京国电通网络技术有限公司信息 - 公司成立于2000年,位于北京市,以从事专业技术服务业为主,注册资本73000万人民币 [1] - 公司共对外投资4家企业,参与招投标项目1978次,有商标信息66条,专利信息943条,拥有行政许可21个 [1] 国网信息通信产业集团有限公司信息 - 公司成立于2015年,位于北京市,以从事软件和信息技术服务业为主,注册资本1502231.015155万人民币 [2] - 公司共对外投资41家企业,参与招投标项目5000次,有商标信息311条,专利信息4572条,拥有行政许可7个 [2]
Deepseek-V3/R1利润率545%怎么算的?
小熊跑的快· 2025-03-02 14:45
理论利润率测算 - 在24小时统计时段内,DeepSeek V3/R1输入token总数为608B,其中342B tokens(56.3%)命中KVCache硬盘缓存,输出token总数为168B,平均输出速率为20~22tps [1] - 若所有tokens按DeepSeek R1定价计算,单日理论收入达562,027美元,成本利润率高达545%,日均成本为87,072美元(GPU租赁成本2美元/小时) [1] - 理论测算基于H800单卡吞吐量:prefill任务输入吞吐73.7k tokens/s(含缓存命中),decode任务输出吞吐14.8k tokens/s [1] 实际利润率影响因素 - 实际利润率显著低于理论值,主因包括:DeepSeek-V3定价低于R1、部分服务未货币化(网页/APP免费)、夜间低峰时段自动折扣 [2] - 按API付费率35%、V3调用占比40%测算,公司处于微利状态;若API付费率提升至65%,利润率可达93% [2] - 满负载状态下日均总Tokens调用量达7760亿,需1.15万张H800(利用率45%),年收入预估9.72亿元 [3] 技术优化方案 - 节点专家并行(EP)通过扩大批量大小提升GPU矩阵计算效率,预填充阶段采用EP32+DP32架构,解码阶段采用EP144+DP144架构 [5] - 计算通信重叠采用双批次重叠策略:预填充阶段拆分微批次交替执行,解码阶段使用5阶段流水线隐藏通信成本 [6] - 负载均衡通过Prefill/Decode Load Balancer实现GPU间计算量均衡,EPLB采用冗余专家策略动态分配高负载专家 [7] 硬件与系统创新 - 分布式文件系统3FS实现跨节点内存直传,免除CPU介入,支持高通量低延迟数据传输 [8] - DualPipe双向流水线并行算法实现前向/后向计算-通信完全重叠,FlashMLA解码内核使H800内存带宽达3000GB/s [8] - 推理服务采用FP8格式矩阵乘法,BF16格式核心计算,日均占用226.75个节点(每节点8张H800) [9] 行业影响 - 开源策略降低国内AI应用对GPU的强依赖,打破IB交换机独占格局 [4] - 技术方案为云厂商提供算力冗余管理新思路,缓解波峰波谷需求压力 [3][4]