核心观点 - 传统联邦学习将数据异质性视为障碍,而FedDRM提出数据异质性是信息,关键在于利用而非消除[2] - FedDRM将联邦学习从“聚合范式”拓展到“路由范式”,使服务器首次具备将外部请求路由至最合适客户端处理的能力[2][5] - 该方法使联邦学习系统首次能以整体的身份对外提供服务,为医疗、金融、物联网等真实场景提供了新的可能性[26][27] 技术原理与方法创新 - 核心问题识别:现有主流个性化联邦学习方法训练了多个本地模型,但缺乏系统层面选择最合适模型处理外部请求的能力[10] - 问题重构:将客户端路由问题转化为一个跨客户端的样本边际分布估计与判别问题,即判断新样本更可能来自哪个客户端[14] - 核心建模方法:首次将联邦学习中的客户端路由问题建模为密度比估计问题,采用密度比模型结合经验似然方法[11][12] - 模型结构:无需额外生成模型,只需在现有网络上增加一个轻量分支即可实现系统级智能[12] - 理论统一性:最大化经验似然函数等价于最小化两个交叉熵风险之和,这并非人为多任务技巧,而是统计建模的必然结果[16][17] - 双能力学习:模型在训练中同时获得对任务的判别能力和对数据来源的识别能力,自然统一了个性化建模与系统路由[17] 性能评估与实验结果 - 新评估指标:引入“系统准确率”以评估联邦系统在收到外部全新查询时,能否做出正确分发决策的能力[20] - 评估流程:服务器先根据样本特征预测最匹配的客户端,再由该客户端的本地模型完成预测[20] - 实验结果:在CIFAR-10/100与专业医疗影像数据集RETINA上,系统准确率相比现有个性化联邦学习方法取得一致提升[12][22] - 具体提升:在真实医疗数据集RETINA上的系统准确率提升约为1.41%–7.67%[24] - 训练优势:训练过程稳定,无需复杂的生成模型[24] 应用前景与行业影响 - 改变服务模式:改变联邦学习系统作为整体的服务方式,服务器角色从参数共享与模型聚合,升级为具备分布推断与路由决策能力的智能调度中心[26] - 医疗协作:可实现将病例自动匹配到最合适的医院模型进行处理[27] - 金融风控:可根据用户分布差异调用专属的风险模型[27] - 物联网:可使边缘节点成为可调度的“专家网络”[27] - 范式转变:联邦学习不再仅是保护隐私的训练框架,而开始成为一个具备结构化决策能力的智能系统[26]
ICLR 2026 | 从「聚合」到「引导」:FedDRM开启客户端智能路由新范式
机器之心·2026-03-17 11:58