联邦学习
搜索文档
微众银行AI学术研究再添新成果,九项技术创新连续获顶会顶刊发表
华尔街见闻· 2025-10-31 20:00
会议与学术成就 - 自然语言处理领域国际顶级会议EMNLP 2025将于2025年11月4-9日在中国苏州举行 该会议每年吸引全球数万名科研人员与工程师参与[1] - 公司有3篇论文被EMNLP 2025大会录取 研究方向包括联邦大模型框架 大模型压缩和推理知识迁移[1] - 2025年公司共有9篇论文入选EMNLP NeurIPS CVPR KDD TIFS TKDE等顶级会议与期刊 创下历年新高[3] - 公司多年来累计在NeurIPS CVPR EMNLP等国际顶会或顶刊发表论文50余篇[4] 公司战略与技术布局 - 公司是中国首家数字银行 秉持“让金融普惠大众”的使命 致力于通过科技创新为普通民众和小微企业提供优质便捷的金融服务[3] - 公司正加速从“数字原生”向“AI原生”跃迁 具体路径包括夯实AI基础设施 深化AI全场景应用 重塑AI原生型组织以及健全AI治理体系 目标是建成全球领先的AI原生银行[3] - AI研究坚持“问题导向 落地优先”的理念 以解决产业实际痛点为目标[4] - 未来公司将围绕“金融科技 智慧民生”两大领域 持续深耕AI核心技术研究 推动研究成果向产业价值转化[5] 行业贡献与认可 - 由公司牵头编写的国家标准GB/T 46284-2025《人工智能 联邦学习技术规范》已于2025年10月5日正式发布实施[3] - 公司联合同济大学 微软亚洲研究院共同获得2025年度中国计算机学会“CCF科技成果奖”自然科学三等奖 显示行业对其技术创新实力的高度认可[3] - 公司的多项AI技术已应用于金融风控 智能客服 反欺诈等核心业务场景[4]
微众银行AI学术研究再添新成果,九项技术创新连续获发表
中国经济网· 2025-10-31 19:39
公司战略与定位 - 公司是国内数字银行的先行者,秉持“让金融普惠大众”的使命,坚定不移走高水平科技自立自强之路 [2] - 公司正加速从“数字原生”向“AI原生”跃迁,致力于建成全球领先的AI原生银行 [2] - AI研究坚持“问题导向、落地优先”的理念,以“解决产业实际痛点”为目标 [3] 研发投入与技术创新 - 公司持续加大在人工智能、区块链、大数据、云计算等前沿领域的研发投入 [2] - 重点突破联邦大模型压缩、大小模型思维链蒸馏、大模型服务化定制等关键技术 [2] - 2025年公司有9篇论文入选EMNLP、NeurIPS、CVPR、KDD、TIFS、TKDE等顶会顶刊,创历年新高 [2] - 多年来累计在NeurIPS、CVPR、EMNLP等国际顶会顶刊发表论文50余篇 [3] 行业认可与标准建设 - 公司牵头编写的国家标准GB/T 46284-2025《人工智能 联邦学习技术规范》正式发布实施,自2025年10月5日起生效 [2] - 公司联合同济大学、微软亚洲研究院共同斩获2025年度中国计算机学会“CCF科技成果奖”自然科学三等奖 [2] - 公司有3篇论文被自然语言处理领域权威学术盛会EMNLP 2025录取 [1] 技术应用与成果转化 - 多项AI技术已应用于公司金融风控、智能客服、反欺诈等核心业务场景 [3] - 未来公司将围绕“金融科技、智慧民生”两大领域,推动研究成果向产业价值转化 [3] - 公司AI研究团队将在EMNLP 2025与全球AI专家学者交流分享联邦大模型框架、大模型压缩、推理知识迁移方向的研究成果 [1]
助力金融风控:G20AI生态筑牢数字金融安全屏障
江南时报· 2025-10-29 11:21
文章核心观点 - G20 GPU构建的金融AI生态通过整合硬件算力、软件算法和数据协同的一体化模式,解决了传统风控系统在亿级用户和每秒千万级交易时代下面临的算力不足、数据割裂和算法滞后等难题 [1] - 该生态实现了更高效精准的数字金融安全屏障,在保障交易安全的同时提升了支付便捷性 [1] 风控系统性能提升 - 在某大型支付平台实现毫秒级风险识别,系统在0.3秒内完成交易行为分析、设备安全校验、历史风险匹配等18项检测并生成风险评分 [1] - 峰值时段每秒处理超过5万笔交易请求 [1] - 通过整合6家算法厂商的反欺诈模型和3家数据安全厂商的加密技术,形成动态调整的风控体系 [1] 模型优化效率与效果 - 反欺诈模型更新周期从过去的1-2周缩短至24小时,通过生态协同机制实时共享最新风险特征 [2] - 欺诈交易拦截率相比之前提升22%,正常交易误判率下降18% [2] - 生态内模型训练平台自动整合数据并对反欺诈模型进行迭代优化 [2] 数据共享与安全机制 - 针对金融行业数据敏感共享困难的痛点,与多家银行保险机构建立跨机构风险数据共享机制 [2] - 通过联邦学习技术实现数据可用不可见,各机构无需共享原始数据,仅上传本地数据模型参数进行加密计算 [2] - 某银行接入该机制后,对信用卡逾期风险的预测准确率提升15%,不良贷款率下降0.8个百分点 [2] 生态应用规模与成效 - 已服务超过20家金融机构,涵盖支付平台、银行、保险、证券等多个领域 [3] - 累计拦截可疑交易金额超过15亿元,处理风险事件超过30万起 [3] - 为数字金融业务平稳运行提供支撑,为行业风控模式创新提供可借鉴范例 [3]
研判2025!中国联邦学习行业产业链、市场规模及重点企业分析:技术框架持续迭代,隐私保护技术助力协同建模[图]
产业信息网· 2025-10-16 09:20
行业概述与定义 - 联邦学习是一种分布式机器学习方法,核心目标是在保护数据隐私的前提下实现多方协作训练模型,原始数据始终保留在本地,仅加密传输模型参数 [2] - 根据数据分布特征、网络结构及参与方角色,联邦学习可分为横向联邦学习、纵向联邦学习和联邦迁移学习三大类 [2] 市场规模与增长 - 2024年中国联邦学习行业市场规模为2.54亿元,同比增长11.89% [1][8] - 行业在政策支持、技术进步和市场需求推动下呈现稳步发展态势 [1][8] 技术发展与核心框架 - 以微众银行FATE、蚂蚁金服共享智能平台为代表的技术框架持续迭代,支持同态加密、安全多方计算等隐私保护技术 [1][8] - 联邦学习有效解决了数据孤岛与隐私安全的矛盾,在多个应用场景中提升模型精度达20%以上 [1][8] - 微众银行开源的FATE框架是全球首个工业级框架,其社区已吸引超4000开发者、800企业参与 [3] 行业发展历程 - 中国联邦学习行业自2017年概念提出后,经历了探索、应用、生态构建至成熟扩展四个阶段 [3] - 2023年至今,联邦学习已成为技术基础设施,并在多行业深度应用 [3] 产业链结构 - 产业链上游主要包括计算硬件、隐私保护软件库、分布式计算框架及云服务 [5] - 产业链中游为联邦学习平台与解决方案提供商 [5] - 产业链下游主要应用于金融、医疗、物流、数字广告、智能交通、政务等领域 [5] 重点企业分析 - 蚂蚁数科以36.7%的市场占有率连续三年位居中国隐私计算市场份额第一,其摩斯隐私计算平台融合多项技术 [8] - 微众银行在金融领域率先应用联邦学习技术,其FATE框架成为行业技术标杆 [8][3] - 百度集团在联邦学习领域技术领先,其PaddleFL框架支持横向联邦与两方安全学习,应用于金融风控等场景 [9] - 腾讯控股聚焦场景深耕与产品化,其T-Sec联邦学习通过加密中间结果交换提升模型效果15% [10] 主要应用场景 - 在金融风控领域,联邦学习技术通过整合不同金融机构的数据,构建更精准的信用评估模型 [7][8] - 在医疗领域实现跨医院数据融合,支持医疗联合诊断 [3][8] - 其他应用场景包括城市交通优化、智能营销、工业互联网设备故障预测及自动驾驶等 [1][8][12] 行业发展趋势 - 联邦学习将深度融合AI大模型、边缘计算及5G/6G技术,形成“分布式AI协同”新生态 [10] - 应用场景将从金融、医疗向工业互联网、自动驾驶、能源管理等更多垂直行业渗透和深度应用 [12] - 随着IEEE P3652.1标准推进及国内《数据安全法》与《个人信息保护法》等政策的完善,联邦学习将形成更规范的产业生态 [13]
对抗协作+原型学习!深北莫FedPall开源,联邦学习破局特征漂移,准确率登顶SOTA
机器之心· 2025-09-24 17:25
研究背景与问题 - 特征偏移问题是联邦学习数据异构场景下普遍存在的挑战 同一类别的样本在不同客户端上表现出不同特征分布 导致决策边界模糊并严重影响分类性能[2] 研究方法与算法 - 提出FedPall算法 结合原型对比学习和对抗协作学习进行联合训练[2] - 客户端与服务器间引入对抗学习机制 通过客户端间协作将特征表示投影到统一特征空间[3] - 采用分层整合全局原型与局部特征的技术策略 混合原型特征用于训练全局分类器[3] - 通过KL散度增强不同客户端的异构信息 利用CE和全局原型对比损失训练特征编码器[5] - 将全局分类器部署至每个客户端取代本地分类器 以增强泛化能力[6] 实验设计与数据集 - 在三个特征漂移数据集(Digits、Office-10和PACS)上评估性能[8] - 与FedAvg、FedProx、FedBN、MOON等经典及SOTA基线方法进行比较[9] 性能表现 - Office-10数据集平均准确率达67.5% 较第二名ADCOL方法(61.4%)高出约6.1个百分点[9][10] - Digits数据集平均准确率达88.7% 较第二名FedBN方法(87.6%)高出约1.1个百分点[9][10] - PACS数据集平均准确率达60.6% 较FedBN方法(59.5%)高出约1.1个百分点[9][12] - 在MNIST-M客户端上准确率达85.9% 显著优于FedBN的76.3%[9][12] - 在Office-10数据集上以31.5个百分点的优势超越FedBN方法[12] 技术优势 - 对抗学习有效缓解MNIST-M客户端中的异构信息问题[12] - 融合对抗学习与协作学习的特殊设计能良好适应现实数据集的显著特征漂移[12] - 在所有子数据集上都取得第一或第二的准确率[12] 应用与局限 - 目前仅针对分类任务设计并在图像数据集上进行评估[12] - 未来计划验证框架在其他模态数据和更多任务类型的泛化能力[13]
抖音巨量广告:竞价推广代运营公司
搜狐财经· 2025-09-12 14:25
行业现状 - 短视频平台成为品牌推广重要战场 抖音凭借庞大用户基数和精准算法成为流量高地 [1] - 巨量广告作为抖音官方广告投放体系 通过竞价模式帮助广告主实现高效曝光与转化 [1] - 面对复杂规则和专业化运营需求 越来越多企业选择将广告账户托管给代运营公司 [1] 企业痛点 - 中小企业自主操作面临多重困境:缺乏经验导致预算浪费 不熟悉OCPM/CPC等计费模式陷入烧钱无效果循环 [2] - 创意内容生产乏力 非专业团队难以产出高转化率素材 [2] - 数据分析能力薄弱 无法有效解读完播率/互动率/转化率等数据指标 [2] - 某美妆品牌自行投放时单条视频消耗500元仅获3个咨询量 代运营后同等预算咨询量飙升至87条 ROI提升近15倍 [2] 核心竞争力 - 精准用户画像构建能力 结合兴趣标签/行为轨迹/地域分布等建立多维度用户模型 [2] - 数据驱动的动态调优机制 采用智能竞价系统+人工干预双重保障 实时监控CTR/CVR/ECPM等关键指标 [5] - 某电商服饰类客户经过两周数据积累与策略迭代 广告组平均CPA下降42% [5] - 爆款内容工业化生产流程 实行标准化内容生产SOP 专业团队打造的视频广告留存时长比企业自制内容高出60%以上 [6] 行业乱象 - 存在不良现象:工作室收取高额服务费却采用刷量手段 专家顾问仅提供通用型方案无定制化能力 挪用客户预算进行二次投资 [7] - 企业选择时应考察案例真实性 要求提供近三个月完整投放数据报告 辨别异常高点赞/转发比例 [7] - 需确认是否取得巨量引擎官方认证服务商资格 [9] - 合同条款需明确约定KPI考核标准/退款机制及数据所有权归属 [9] 未来趋势 - 行业朝智能化/精细化方向演进 自动化工具逐步接管基础操作岗位 人力聚焦战略决策支持 [10] - 跨平台整合能力成为新竞争壁垒 能统筹管理抖音/快手/微信生态等多渠道资源的服务商更受青睐 [10] - 隐私计算技术突破或催生基于联邦学习的联合建模新模式 在保护用户隐私前提下实现更精准广告定向 [10]
礼来开放其价值超10亿美金AI制药平台!邀中小企业共享“数据金矿”
生物世界· 2025-09-10 17:00
核心观点 - 礼来公司宣布开放其价值超过10亿美元的AI药物研发平台Lilly TuneLab 采用联邦学习技术使生物技术公司无需共享核心数据即可利用其AI模型进行药物发现 旨在解决中小企业数据短缺问题并推动行业创新 [3][4][7] 平台价值与技术 - Lilly TuneLab是一个基于礼来多年研究数据训练的机器学习平台 涵盖药物处置、安全性和临床前数据 数据成本总和超过10亿美元 被列为行业最有价值的数据集之一 [4] - 平台采用联邦学习技术 由第三方托管 合作公司无需直接共享专有数据或获取礼来原始数据 即可使用AI模型 实现数据隐私保护下的模型共同进化 [4] - 平台旨在为中小生物技术公司提供与礼来科学家同等的AI能力 平衡行业资源差距 [5] 合作模式与生态建设 - 合作公司需贡献自身训练数据以推动平台持续改进 最终惠及整个生态系统和患者 [5] - 该平台是礼来Catalyze360计划的一部分 该计划还包括风险投资部门Lilly Ventures和孵化器部门Gateway Labs 旨在全方位支持行业创新 [6] 行业痛点与解决方案 - 中小生物技术公司面临缺乏大规模高质量数据的根本障碍 影响AI模型训练和关键决策 [7] - Lilly TuneLab将礼来数十年的学习成果压缩为即时可用的智能 直接解决数据短缺问题 [7] 未来发展规划 - 礼来计划在未来版本中增加体内小分子预测模型等功能 持续扩展平台能力 [8] - 开放平台是制药巨头利用数据优势重塑行业生态的尝试 为中小公司提供拥抱AI的新机会 [8]
医药生物-医药行业行业研究:从数据、算力、模型切入的3类龙头,看全球AI
搜狐财经· 2025-08-31 11:08
行业趋势与核心观点 - AI制药已从概念迈向现实,2024年Hassabis与Jumper因AlphaFold2获诺贝尔化学奖标志行业开启,多组学AI应用将实现医药领域1000倍降本增效,首个AI重磅药临近获批 [1][4] - 行业核心三要素(算力、数据、模型)瓶颈逐步突破:算力云端化且持续升级,数据通过联邦学习及跨界合作突破孤岛限制,生成式AI模型成为竞争关键 [1][4] - AI开发药物I期试验成功率80%-90%,远超传统方法的40%,全球AI药企管线加速进入临床阶段 [1][4][64] 算力进展 - 云端算力供给充裕,亚马逊、谷歌、微软、阿里等科技巨头提供基础设施支持 [1][4] - 英伟达2025年推出Spectrum-XGS以太网技术,可连接分布式数据中心形成“AI超级工厂”,提升算力量级 [1][4][14] - 云计算驱动制药行业数字化转型,实现数据存储、分析及AI模型训练的高效扩展,成本降低达40% [39] 数据突破 - 联邦学习(FL)技术突破数据隐私与孤岛限制,实现跨设备及跨孤岛的知识共享 [4][43] - Apheris等企业及英国“OpenBind”联盟整合跨界数据,英国联盟计划5年生成50万个蛋白质-配体复合物结构数据,填补行业空白 [1][4][53] - 医疗数据量激增,英国生物数据库储存50万名患者信息,数据量是Meta LLaMA 3.1405B模型的27倍 [26][30] 模型与研发效率 - 生成式AI是关键竞争壁垒,英矽智能Pharma.AI平台(含Biology42、Chemistry42等模块)实现端到端研发,模型迭代时间从50天缩短至3天 [1][31] - 全球25家领先AI药企中,部分企业管线进入临床,英矽智能针对TNIK、ENPP1、PHD抑制剂3次复现成功且研发过程在Nature披露 [1][4][32] - AI模型可解释性受欧盟《人工智能法案》推动,依赖黑箱模型的系统可能退出市场 [4][31] 行业参与格局 - 科技巨头加速入局:英伟达推BioNeMo平台并投资13家AI药企,谷歌拆分Isomorphic Labs且临床试验临近 [1][5][15] - 产业链企业积极布局:泓博医药推DiOrion平台,深度智耀赋能IND合规提交,英矽智能10种候选化合物获批IND [1][5] - 默沙东、辉瑞等十大制药巨头投入数百亿美元,近5年全球AIDD相关交易总额超500亿美元,85%头部药企加大AI投资 [1][5][20] 投资策略与方向 - AI新药破局在即,关注管线丰富、兑现力强的企业如英矽智能、晶泰控股 [6] - 制药与跨界企业入局者众,优选壁垒随时间增厚者如石药集团、复星医药等长期布局AI的公司 [6]
促进和规范数据跨境流动,将对智能汽车进出口有何影响?
中国汽车报网· 2025-08-28 14:30
数据跨境流动政策背景 - 商务部提出促进和规范数据跨境流动 加快发展国际数据服务业务 为智能网联汽车进出口带来利好信号 [3] - 《数据安全法》实施四周年 主管部门此时推动数据跨境流动对智能汽车产业具有特殊意义 [3] - 我国构建数据跨境流动政策体系 2021年9月1日施行《数据安全法》确立数据分类分级保护制度 2021年11月1日实施《个人信息保护法》规范个人信息跨境传输 [5] 智能网联汽车数据规模 - 智能网联汽车已成为数据终端 每天产生TB级海量数据 [4] - 数据包含驾乘人员面部表情、动作、目光、声音数据 以及车辆地理位置、车内外环境、车联网使用数据 [4] - 特斯拉等智能汽车进口和中国智能汽车出口增多 使数据跨境流动成为重要现实课题 [5] 监管体系完善进程 - 2024年3月22日网信办发布《促进和规范数据跨境流动规定》 [6] - 2025年6月13日八部门联合发布《汽车数据出境安全指引(2025版)(征求意见稿)》 标志监管走向精细化专业化 [6] - 要求企业完成全面安全评估 区分一般数据/重要数据/核心数据实施差异化管理 建立内部管理制度 [6] 国际政策对比 - 欧盟以GDPR为核心实行严格数据本地化要求 限制数据跨境流动 除非接收方具备充分保护水平 [7] - 我国智能网联汽车企业在欧盟市场面临数据处理与传输挑战 需投入大量资源满足合规要求 [7] 企业合规实践 - 上海自贸区临港新片区2024年5月公布智能网联汽车领域数据跨境场景化一般数据清单 包含11个场景64个数据类别600余个字段 [8] - 特斯拉在中国建立本地化数据中心 将在华销售车辆产生数据全部存储于境内 满足数据本地化存储要求 [9] - 企业采用隐私计算、联邦学习技术实现数据"可用不可见" 使中外研发团队可不转移原始数据协同训练驾驶行为数据 [10] 技术解决方案 - 动态脱敏技术根据使用场景与风险等级实时对敏感数据变形处理 保持匿名状态 [11] - 智能加密技术运用先进算法加密数据 仅授权特定主体可解锁查看 [11] - 行业组织提出"事前评估-事中监控-事后审计"全流程管理体系 形成良好自律氛围 [11] 战略发展建议 - 出口端需构建技术合规+本地化运营双引擎 满足国际法规并精准对接当地需求 [12] - 进口端需打造数据主权保护+功能本土化竞争力 对进口车辆智能驾驶功能深度本土化适配 [12] - 率先建立数据合规体系并平衡安全与发展的企业 将在全球化竞争中赢得优势 [12]
数据“中毒”会让AI“自己学坏”
科技日报· 2025-08-19 08:18
AI数据中毒威胁 - AI系统在学习过程中输入错误或误导性数据会形成错误认知并作出偏离预期的判断[1] - 数据中毒攻击通过连续欺骗系统可逐渐腐蚀系统为后门植入和数据窃取埋下隐患例如攻击者用红色激光欺骗火车站摄像头30天[2] - 线上系统尤其是依赖社交媒体和网页内容训练的大语言模型中数据投毒已是重大隐患[2] AI爬虫数据采集风险 - 2024年AI爬虫流量首次超过人类用户其中OpenAI的ChatGPT-User占全球网页访问量6% Anthropic的ClaudeBot占13%流量[2] - AI模型大规模采集网页内容可能将故意投放的有毒数据如篡改版权材料和伪造新闻信息带入模型[3] - 有毒数据可能导致版权侵权虚假信息扩散和在关键领域引发安全风险[3] 版权保护技术反击 - 创作者采取技术手段保护版权例如芝加哥大学团队开发Glaze工具可加入像素级干扰使AI误判作品类型[4] - Nightshade工具能在图片植入隐蔽特征使AI学习错误对应关系该工具发布一年下载量超1000万次[4] - Cloudflare公司推出AI迷宫通过制造海量虚假网页消耗AI爬虫算力和时间[4] 去中心化防御技术 - 联邦学习技术允许模型在分布式设备本地学习只汇总参数降低单点中毒风险[5][6] - 区块链技术凭借时间戳和不可篡改特性使模型更新过程可追溯便于定位投毒源头[6] - 多个区块链网络可互相通报可疑模式当识别威胁时立即警示其他系统[6]