Workflow
联邦学习
icon
搜索文档
Meta又一AI大将跟LeCun跑了
量子位· 2026-03-22 14:28
文章核心观点 - Meta人工智能研究部门(FAIR)的资深研究员John Nguyen被其前领导、Meta AI研究创始负责人Yann LeCun新创立的公司AMI挖走,这反映了Meta在人工智能领域面临的人才流失和内部动荡,而LeCun的创业公司因聚焦“世界模型”等前沿方向并获得巨额融资,正吸引着原Meta核心人才[1][6][27][38] 关键人物背景与动向 - John Nguyen在Meta(FAIR)任职6年零3个月,是团队中坚力量,其研究路径完整跟随了Meta从联邦学习、大模型训练到多模态的技术演进主线[3][15][18][20] - John Nguyen拥有加州大学戴维斯分校统计学和计算机双学士及计算机硕士学位,自大学时期起便在亚马逊、Meta等公司实习,毕业后即加入Meta[12][13][14] - 此次挖角事件是LeCun创业后一系列人才追随的延续,此前已有谢赛宁、Mike Rabbat等FAIR前成员加入AMI[6] - 行业中存在顶尖人物创业并带走核心团队的先例,如乔布斯离开苹果、李飞飞创立公司、Ilya离开OpenAI等,这背后是人才对技术方向和方法论的追随[21][22][23][24][25] 技术研究方向与行业趋势 - John Nguyen在Meta的研究始于联邦学习,关注分布式训练效率与隐私保护,相关论文引用量达数百次(如547次、200次、177次)[16][18] - 随着大语言模型兴起,其研究重心转向大规模深度学习训练,解决大模型训练在工程层面的挑战[18][19] - 其后研究方向扩展至多模态模型,关注应用与能力构建[20] - 行业观点认为,当下稀缺的是既懂底层训练、又跨越多模态并能承接“世界模型”的人才,而“预测下一个token”的范式正逼近上限,行业开始转向对现实世界的建模[20][26] - LeCun创立的AMI及其追随者(如谢赛宁)认为,大语言模型主导的现状存在局限,担忧“语言对视觉的污染”,并将“世界模型”视为下一阶段的解决方案[8][9][10] 公司现状与竞争格局 - LeCun创立的AMI成立仅4个月,团队25人,在无产品、无收入、无客户的情况下获得了10.3亿美元(约合人民币71亿元)的种子轮融资,投前估值高达35亿美元(约合人民币241亿元),投资方包括英伟达、三星、丰田、淡马锡等,被称为“AI领域有史以来规模最大的种子轮”[28] - Meta面临内部动荡,FAIR部门被逐渐边缘化,且近期有传闻称其首席AI科学家(亚历山大王)可能被更换,尽管公司已辟谣,但形象已受损[5][31][32] - Meta在新模型开发上进展不顺,原计划去年底发布的新模型“牛油果”已推迟至2026年第一季度,截至3月底仍无正式消息[33][34][35] - Meta在追赶行业热点(文中喻为“龙虾”)时出现运营问题,包括高管邮件被误删以及内部数据未经授权泄露两小时,进一步强化了公司当前“不顺”的印象[36][37]
ICLR 2026 | 从「聚合」到「引导」:FedDRM开启客户端智能路由新范式
机器之心· 2026-03-17 11:58
核心观点 - 传统联邦学习将数据异质性视为障碍,而FedDRM提出数据异质性是信息,关键在于利用而非消除[2] - FedDRM将联邦学习从“聚合范式”拓展到“路由范式”,使服务器首次具备将外部请求路由至最合适客户端处理的能力[2][5] - 该方法使联邦学习系统首次能以整体的身份对外提供服务,为医疗、金融、物联网等真实场景提供了新的可能性[26][27] 技术原理与方法创新 - **核心问题识别**:现有主流个性化联邦学习方法训练了多个本地模型,但缺乏系统层面选择最合适模型处理外部请求的能力[10] - **问题重构**:将客户端路由问题转化为一个跨客户端的样本边际分布估计与判别问题,即判断新样本更可能来自哪个客户端[14] - **核心建模方法**:首次将联邦学习中的客户端路由问题建模为密度比估计问题,采用密度比模型结合经验似然方法[11][12] - **模型结构**:无需额外生成模型,只需在现有网络上增加一个轻量分支即可实现系统级智能[12] - **理论统一性**:最大化经验似然函数等价于最小化两个交叉熵风险之和,这并非人为多任务技巧,而是统计建模的必然结果[16][17] - **双能力学习**:模型在训练中同时获得对任务的判别能力和对数据来源的识别能力,自然统一了个性化建模与系统路由[17] 性能评估与实验结果 - **新评估指标**:引入“系统准确率”以评估联邦系统在收到外部全新查询时,能否做出正确分发决策的能力[20] - **评估流程**:服务器先根据样本特征预测最匹配的客户端,再由该客户端的本地模型完成预测[20] - **实验结果**:在CIFAR-10/100与专业医疗影像数据集RETINA上,系统准确率相比现有个性化联邦学习方法取得一致提升[12][22] - **具体提升**:在真实医疗数据集RETINA上的系统准确率提升约为**1.41%–7.67%**[24] - **训练优势**:训练过程稳定,无需复杂的生成模型[24] 应用前景与行业影响 - **改变服务模式**:改变联邦学习系统作为整体的服务方式,服务器角色从参数共享与模型聚合,升级为具备分布推断与路由决策能力的智能调度中心[26] - **医疗协作**:可实现将病例自动匹配到最合适的医院模型进行处理[27] - **金融风控**:可根据用户分布差异调用专属的风险模型[27] - **物联网**:可使边缘节点成为可调度的“专家网络”[27] - **范式转变**:联邦学习不再仅是保护隐私的训练框架,而开始成为一个具备结构化决策能力的智能系统[26]
不共享数据,也能联合训练,UCL团队用联邦学习重塑血液形态学检查
36氪· 2026-02-13 17:55
研究核心成果 - 伦敦大学学院研究团队提出名为“MORPHFED”的联邦学习框架,用于白细胞形态分析,使各机构能在不交换原始训练数据的情况下进行协同训练 [1][2] - 该联邦模型利用来自多个临床站点的血液涂片数据,在保证完全数据隐私的同时,学习到稳健且域不变的特征表示 [1][2] - 与集中式训练相比,联邦训练在跨站点性能和对未知机构的泛化能力上表现出色 [1][2][5] 研究背景与挑战 - 血液形态学检查是诊断白血病、贫血等血液疾病的重要环节,但过程劳动强度大且高度依赖专家,在低收入和中等收入国家尤其面临专家稀缺的挑战 [1] - AI模型为自动化血液学诊断提供潜力,但面临数据异质性(染色方法、成像设备差异)导致的泛化能力下降,以及医疗数据隐私限制带来的跨机构数据共享难题 [2] 数据集与实验设计 - 研究使用了来自两个医疗中心的数据集,包含11种共同细胞类型,总计Client 1 (JHH) 21,200张图像和Client 2 (MUH) 8,985张图像,保留了染色和成像差异以测试异质环境下的泛化能力 [5][6] - 保留了来自巴塞罗那临床医院(Client 3)的12,992张图像作为独立外部验证集,用于测试模型在完全未见过机构数据上的表现 [8] - 研究采用了两类深度学习架构:ResNet-34和DINOv2-Small,并对比了四种联邦聚合策略:FedAvg、FedMedian、FedProx、FedOpt [9][12] 模型性能评估 - 在联合测试集评估中,联邦学习显著提升了性能,相比仅使用单个机构数据训练的模型(58% vs 52% 平衡准确率)[16] - 联邦模型的性能略低于对所有数据进行集中训练的模型,但在保持完整数据隐私的同时,仍能达到可比精度 [16] - 在外部分布数据泛化评估中,联邦方法(FedMedian和FedOpt)在完全未见过的Client 3数据上的泛化能力优于集中式训练(平衡准确率 67% vs 64%)[17][18] - FedMedian在少数类细胞识别上提升显著,例如带状中性粒细胞F1分数为0.62,相比集中式的0.30提升107%;早幼粒细胞F1分数为0.61,相比集中式的0.35提升74% [19] 联邦学习的行业意义与应用 - 联邦学习是一种“数据不出域、模型可协作”的协同机器学习范式,能有效保护数据隐私并满足严格的数据合规要求,成为破解医疗“数据孤岛”的关键技术 [20][21] - 在医疗影像领域,联邦学习使得不同医院能够在不共享原始影像数据的情况下联合训练模型,从而提升模型对不同设备、协议和患者群体的泛化能力 [21] - 已有公司如Owkin在推进联邦学习在医疗行业的应用,并开源了联邦学习软件Substra,用于临床研究和药物研发 [20][21] - 联邦学习所代表的“分布式协同智能”模式,正在成为未来医疗AI规模化部署的重要基础设施,为隐私保护型医学大模型的训练提供了可行路径 [22]
中移取得联邦学习方法系统和存储介质专利
搜狐财经· 2026-02-03 15:00
中国移动集团及子公司获得联邦学习专利 - 中国移动通信集团有限公司及其两家子公司(中移(上海)信息通信科技有限公司、中移智行网络科技有限公司)共同获得一项名为“联邦学习方法、系统和存储介质”的专利,授权公告号为CN116090586B,该专利的申请日期为2021年11月 [1] 中移(上海)信息通信科技有限公司概况 - 公司成立于2018年,位于上海市,主营业务为科技推广和应用服务业,企业注册资本为200,000万人民币(即200亿人民币)[1] - 公司参与招投标项目2,020次,拥有商标信息34条,专利信息953条,以及行政许可6个 [1] 中移智行网络科技有限公司概况 - 公司成立于2015年,位于上海市,主营业务为软件和信息技术服务业,企业注册资本为100,000万人民币(即100亿人民币)[1] - 公司参与招投标项目705次,拥有商标信息106条,专利信息861条,以及行政许可8个 [1] 中国移动通信集团有限公司概况 - 公司成立于1999年,位于北京市,主营业务为电信、广播电视和卫星传输服务,企业注册资本为30,000,000万人民币(即3,000亿人民币)[2] - 公司共对外投资了55家企业,参与招投标项目5,000次,拥有商标信息2,211条,专利信息5,000条,以及行政许可50个 [2]
爱尔眼科参与起草《优化消费环境 放心消费品牌评价规范》
搜狐财经· 2026-01-27 10:53
行业标准与规范 - 2025年1月24日,品牌强国经济论坛在北京举行,会上正式启动了《优化消费环境 放心消费品牌评价规范》团体标准的宣贯工作 [1] - 该标准由全国商报联合会联合国家市场监督管理总局发展研究中心、对外经济贸易大学中国国际品牌战略研究中心等权威机构牵头起草 [1] - 标准构建了涵盖经营基本情况、消费环境创建、质量安全放心、消费者权益保护、消费服务保障、诚信信用、社会责任等多维度的完整评价指标体系,旨在为行业规范化发展与放心消费品牌建设提供科学指引 [1] - 公司作为该标准的起草单位之一,将自身在眼科医疗服务领域二十余年的发展经验融入标准制定中,助力消费环境优化与放心消费生态构建 [1] 公司业务模式与网络 - 公司针对医疗资源分配不均的问题,创造了适应国内市场的分级连锁模式,打造“横向成片、纵向成网”的立体化眼科服务网络,推动优质医疗资源共享下沉 [2] - 公司以“共享全球眼科智慧”为目标加速国际化,已基本实现医疗技术、设备、药品与国际水平的“三同步”,旨在让创新技术更早惠及中国患者 [2] 医疗质量与安全管理 - 医疗质量与安全管理是公司发展的核心驱动力,公司通过健全质量管理体系、完善制度规范、强化风险防控、推进智能监管等举措,不断完善集团化医疗高质量管理体系 [2] - 公司在门诊量、手术量、出院人次稳健增长的同时,质控成绩突出,例如2024年,角膜移植术、玻切术等高等级手术的术后感染性眼内炎发生率低至0.0156%,优于国际平均水平 [2] 技术创新与数字化转型 - 公司加速推进眼科医疗数字化转型,首创“数字眼科”发展新模式 [3] - 公司在人工智能、大语言模型、联邦学习等前沿技术领域持续发力,全面打造“爱尔AI数字眼科医院”,旨在实现眼健康服务全流程的智能闭环管理 [3] - 公司致力于将人工智能的高水平服务普及到全生命周期的眼健康医疗服务中,以提升医疗服务的精准性、可及性与效率,惠及更多基层患者 [3] 未来发展规划 - 未来,公司将以《优化消费环境 放心消费品牌评价规范》团体标准为重要指引,持续深化技术创新,迭代升级服务品质 [3] - 公司致力于以专业力量守护患者光明福祉,为推动中国眼科行业高质量发展、构筑放心医疗消费生态贡献力量 [3]
医渡科技宫如璟达沃斯之行:密集开展国际对话,释放AI医疗价值与全球合作战略
搜狐财经· 2026-01-26 16:01
公司动态与全球参与 - 医渡科技创始人、董事长宫如璟女士应邀出席世界经济论坛第56届年会(冬季达沃斯论坛),参与多场高级别行业对话、闭门会议,并密集会见了全球政商学界领袖与合作伙伴 [1] - 会议期间,宫如璟女士与香港特区政府财政司司长陈茂波、港交所董事会主席唐家成进行了交流,介绍了公司发展近况 [7] - 宫如璟女士与诺华、正大集团、西门子医疗等多家企业高管就AI医疗落地、药物研发赋能、行业趋势研判等潜在合作方向深入交换意见 [7] - 宫如璟女士接受了CCTV、CGTN、彭博社等多家国内外重要媒体的采访,阐述了公司通过人工智能技术助力医疗行业智能化转型的探索与成果 [7] 行业洞察与公司观点 - 气候变化正以“渐进渗透”与“突发冲击”双重方式影响全球疾病负担,催生新的健康挑战与市场需求 [1] - AI医疗企业可依托人工智能等技术,助力监测气候敏感疾病趋势、加强公共卫生预警、创新慢性病管理模式,从而系统提升社会健康韧性 [1] - 真正的健康安全不仅依赖全球协同的数据基础设施,更需扎根本地的技术共建与可持续能力培育 [3] - 中国AI医疗凭借丰富的应用场景、日益完善的数据生态和有力的政策支持,已形成独特的发展优势 [5] - 中国经验的全球价值不仅体现在技术突破上,更在于系统化的工程落地能力与高效的本地化适配模式 [5] - 呼吁国际社会加强在伦理标准互认、跨国联合研究以及长期资本与人才流动等方面的协作,共同构建可信、可持续的全球医疗AI生态 [5] 技术实践与解决方案 - 公司正通过联邦学习等隐私计算技术,在保障数据安全的前提下,提升跨区域模型的训练效率与算法普适性 [3] - 在文莱,公司已将大流行期间构建的应急平台转化为国家级健康管理应用“BruHealth”,实现对慢性病的规模化主动管理 [3] - 该平台已覆盖文莱85%以上人口,深度融入民众日常健康管理,成为该国全民健康体系的核心数字支撑 [3] 战略合作与项目进展 - 诺华公司董事会主席Giovanni Caforio博士在达沃斯宣布,诺华基金会、文莱卫生部与医渡科技旗下EVYD公司将联合实施数智驱动的心血管疾病防控项目“CARDIO4Cities” [7]
【全网无错版】上周末,唐杰、杨强、林俊旸、姚顺雨真正说了什么?
机器人圈· 2026-01-13 17:41
文章核心观点 文章记录了2026年初中国AI领域一场汇聚顶尖学者与产业界核心人物的圆桌讨论,探讨了中国大模型行业的发展分化、AGI的下一个技术范式、Agent战略以及中国AI的未来前景[1][6]。核心观点认为,中国AI行业在经历了2025年开源模型的爆发式增长后,正进入一个关键的分化与战略选择期,行业需从追随转向引领,通过聚焦特定方向、探索新范式、发展Agent应用并改善创新环境,以在全球竞争中占据领先地位[6][22][57][70]。 话题1:中国大模型将如何分化? - **市场出现To C与To B的明显分化**:ChatGPT和Claude Code分别被视为To C和To B的典范。To C应用对智能强度的需求增长放缓,而To B应用则因智能直接关联生产力,对最强模型有明确的付费意愿溢价[8][9][10][11]。 - **技术路径出现垂直整合与模型应用分层分化**:在To C场景,模型与产品强耦合的垂直整合模式依然有效(如ChatGPT、豆包)。但在To B生产力场景,趋势是模型层与应用层分离,强大的基座模型被多样化的应用层产品所利用[12]。 - **企业战略分化基于自身基因与数据优势**:腾讯作为To C基因强的公司,其瓶颈在于为模型提供更多上下文(Context)和环境(Environment),而非单纯追求模型规模[13][14]。大公司可利用其内部多样化的真实场景数据来训练模型,这相比依赖外部数据标注商能获得独特优势[15]。 - **分化是自然演进与客户需求驱动的结果**:行业分化并非完全预设,而是在与客户频繁交流中自然发现机会(如Anthropic聚焦Coding和Finance),中国SaaS市场环境与美国不同也影响了分化路径[17][18]。 - **学术界与工业界的分化与协作**:工业界在资源投入上主导发展,学术界应跟进解决基础科学问题,如智能上界、资源分配效率、哥德尔不完备定理下的幻觉消除极限等[19][20]。 话题2:AGI的下一个范式 - **自主学习(Self-learning)成为硅谷共识与热点方向**:该方向已被广泛讨论,但其具体形态因场景和奖励函数不同而多样,例如聊天个性化、编码环境适应、科学探索等[23]。 - **自主学习已在特定场景下以渐变形式发生**:例如ChatGPT利用用户数据优化聊天风格,Claude Code项目95%的代码由自身编写以实现自我改进,这被视为一种特定场景下的AGI体现[24]。 - **新范式的瓶颈在于想象力与评估标准**:实现突破的关键条件可能已部分具备(如Cursor的模型利用实时用户数据更新),但更大的挑战是如何定义和验证“实现了自我学习”的成功标准[25][26]。 - **OpenAI仍被视为最有可能引领新范式的公司**,尽管其商业化可能削弱了部分创新基因[26]。 - **强化学习(RL)的潜力尚未充分释放**:RL的计算规模(Compute)尚未充分扩展,仍存在基础设施(Infra)问题,其潜力有待进一步挖掘[27]。 - **Task-time Scaling(任务时间缩放)与主动性(Active Learning)是关键探索方向**:让AI在单次任务中通过消耗更多计算时间(Token)变得更强,以及让AI能根据环境信号自主启动并规划任务,是重要的范式候选,但伴随安全担忧[27][28]。 - **个性化(Personalization)可能是自主学习早期落地的场景**,但如何衡量AI时代的个性化效果成为新的技术挑战[29][30]。 - **记忆(Memory)技术的突破可能是线性发展后的感知临界点**:技术本身线性发展,但当记忆能力达到某个临界点,用户体验可能发生跃迁,类似电影《Her》中的效果,这可能需要一年左右时间[31]。 - **联邦学习(Federated Learning)代表的协作范式前景广阔**:通过“多个中心协作”模式,能结合通用大模型与本地专业化模型,在医疗、金融等隐私要求高的领域具有应用潜力[34]。 - **2026年出现新范式变革的驱动力增强**:学术界算力资源提升使其具备创新基础;工业界持续投入的边际效率下降,催生对“智能效率”(Intelligence Efficiency)提升新范式的需求[35][36][37]。 话题3:Agent战略 - **To B的Agent已进入价值上升曲线**:Anthropic的路径表明,在To B领域,模型智能提升与解决任务数量、商业收入增长高度一致,使得生产力Agent的发展势头强劲[41]。 - **当前Agent发展的两大瓶颈是环境部署与用户教育**:即使模型能力停滞,通过更好部署到各行业也能带来巨大经济收益(潜在影响GDP 5%~10%,目前远低于1%)。同时,会使用AI工具的人与不会使用的人之间的能力差距正在拉大,教育至关重要[41][42]。 - **产品哲学趋向“模型即产品”(Model as a Product)或“研究即产品”(Research as a Product)**:成功的Agent产品(如Manus)以及OpenAI的模式显示,研究员端到端地将研究转化为产品是重要趋势[43]。 - **未来的Agent将是“托管式”且与自我进化、主动学习强相关**:能够执行长时间、通用任务的Agent,需要在任务过程中自我进化并主动决策,这对模型能力提出更高要求[44]。 - **Agent的终极潜力在于与复杂物理环境交互**:超越电脑环境,指挥机器人进行湿实验等操作,才能实现自动化人类更长时间工作流的愿景,这可能需3-5年并与具身智能结合[45][46]。 - **通用Agent的机会在于解决长尾需求**:与推荐系统类似,解决海量个性化、非标的长尾问题是AI和通用Agent的核心魅力与挑战所在[46][47]。 - **强化学习(RL)降低了修复模型问题的难度**:相比以前,现在只需少量查询(Query)和奖励(Reward)数据,就能通过RL快速优化模型在特定问题上的表现[48][49]。 - **Agent将经历从人工定义到内生自动化的四个阶段**:从当前目标与规划皆由人定义,最终发展为目标和规划均由大模型自主定义的内生(Native)系统[51][52]。 - **Agent成功的三要素是价值、成本与速度**:需解决有真实价值的问题、控制实现成本,并在快速迭代的时间窗口内建立优势[54][55]。 话题4:中国AI的未来 - **中国在技术追赶和工程复现方面具备强大能力**:一旦技术路径被证明可行,中国团队能快速跟进并在局部做到更好,制造业和电动车已有先例[57]。 - **突破新范式需要更多冒险精神与前沿探索**:中国拥有大量顶尖人才,但相较于美国,愿意从事高风险、探索性前沿研究的人可能还不够多,这受经济、商业环境和文化因素影响[58]。 - **研究文化更倾向于做确定性高和看重榜单排名**:国内研究更聚焦已被验证的路径(如预训练),对探索性方向(如长期记忆)相对谨慎。同时,相较于海外更注重实际体验(如Claude的实用性),国内有时对刷榜数字看得更重[60][61]。 - **算力资源分配存在差距,但可能催生“穷则思变”的创新**:美国在用于下一代研究的计算资源上领先中国1-2个数量级,中国大量算力用于产品交付。资源紧张可能反而激励算法与基础设施的联合优化等效率创新[62][63][64]。 - **年轻一代冒险精神增强与营商环境改善是积极信号**:90后、00后的冒险精神更强,结合中国营商环境的持续改善,为创新提供了可能[65][70]。 - **对中国团队3-5年内成为全球AI领导者的概率判断存在分歧**:林俊旸认为概率低于20%,主要因历史积淀和算力差距[66]。姚顺雨表示乐观,认为关键在于能否引领新范式[57][58]。杨强回顾互联网发展,认为中国在应用层面,尤其是To C领域,有望百花齐放并领先[66][68]。 - **成功的关键条件包括人才、环境与坚持**:需要敢于冒险的聪明人、更有利于创新的营商环境(减少交付压力、鼓励竞争),以及从业者在选定的道路上笨拙而持久的坚持[69][70][71]。
联邦学习不再安全?港大TPAMI新作:深挖梯度反转攻击的内幕
机器之心· 2026-01-11 12:00
文章核心观点 - 联邦学习作为隐私保护的协同训练范式,其安全性因梯度反转攻击而面临严峻挑战,攻击者可能仅凭共享的梯度信息重建客户端的私有训练数据[3][5] - 一项由多所大学合作发表在IEEE TPAMI上的研究,首次对梯度反转攻击进行了系统性分类、理论分析和实验评测,并提出了实用的三阶段防御指南[3][6][24] 梯度反转攻击的方法分类 - 基于优化的攻击:通过迭代优化虚拟数据,使其梯度与真实梯度距离最小化,代表方法有DLG、Inverting Gradients等[10][12] - 基于生成的攻击:利用预训练的生成模型作为先验来生成近似输入数据,可细分为优化隐向量、优化生成器参数或训练逆向生成模型[10][12] - 基于分析的攻击:利用模型层的线性特性,通过解析解直接恢复输入数据,通常需要恶意服务器修改模型架构或参数[10][12] 理论突破 - 定理1:首次从理论上证明了基于优化的攻击的重建误差与批量大小和图像分辨率的平方根呈线性关系,即批量越大、分辨率越高,攻击难度越大[11] - 命题1:揭示了模型训练状态对攻击的影响,当不同数据的梯度越相似时,攻击恢复数据的难度就越大[13] 实验发现与关键结论 - 实验在CIFAR-10/100、ImageNet、CelebA等数据集上进行,覆盖了ResNet、ViT及LoRA微调场景[15] - 基于优化的攻击最实用且无额外依赖,但其效果受批量大小和分辨率限制,且在实用的多步本地训练场景下威胁被大幅削弱[25] - 基于生成的攻击能生成高质量图像,但严重依赖预训练生成器、辅助数据集或特定的Sigmoid激活函数,条件不符时易失效[25] - 基于分析的攻击可实现精准数据恢复,但因需修改模型而容易被客户端检测,实践中难以得逞[25] - 在LoRA微调大模型的场景中,攻击者可恢复低分辨率图像,但在高分辨率上常失败,且预训练模型越小,隐私泄露风险越低[25] 防御指南 - 网络设计阶段:避免使用Sigmoid激活函数,采用更复杂的网络架构以增加优化难度[22][26] - 训练协议阶段:增大批量大小以混淆梯度,并采用多步本地训练来破坏梯度的直接对应关系[22][26] - 客户端校验阶段:客户端在接收服务器下发的模型时,应校验模型架构和参数,防止被植入恶意模块[22]
海尔消费金融2025年“特征英雄”落下帷幕,数智化风控质效显著
搜狐财经· 2026-01-06 15:50
公司近期活动与成果 - 海尔消金2025年“特征英雄”活动圆满收官 该活动旨在激发全员坚持数据科学驱动理念 深度挖掘金融服务场景中数据驱动的核心价值 扩充多维数据样本并验证数据特征核心优势[1] - 活动共吸引32名员工参与 从海量数据中挖掘出2023个高质量特征 相当于为风控系统增添了2023个新工具与新视角[5] - 2025年公司智能风控系统累计上线实时特征达10,427个 同比大幅增加70%[6] - 公司通过举办此类竞赛活动 激发全员拥抱AI的热情 强化数据驱动理念 挖掘数据资产 拓展特征来源和衍生技术 以服务实际业务并持续输出落地价值[6] 风控技术应用与创新 - 公司利用大模型替代人工对语音数据进行批量处理 提取有效信息用于信贷模型研发 以降低信用风险[5] - 公司挖掘信贷场景中时序特征的潜在价值 突破传统“静态快照”局限 利用RNN、Transformer等序列模型解析用户信息时序数据 精准识别“以贷养贷”行为以阻断风险传导[5] - 通过使用多模态大模型 提升了意图识别和风险判定的精度 能精准捕捉“还款困难”等语义特征[5] - 智能预警模型使早期风险识别效率提升10% 为信贷业务安全稳定开展提供保障[5] - 公司将AI深度嵌入全流程风控系统 既大幅降低了欺诈风险 又有效提升了信贷审批效率 形成“风险可控、服务高效”的双重优势[6] 行业趋势与公司战略 - 在数字经济与金融科技深度融合的背景下 以大模型、图学习、自然语言处理为代表的深度学习技术的成熟和普及 对信贷风控模型产生了颠覆性影响 行业呈现出多种人工智能技术融合应用的趋势[6] - 未来 随着联邦学习、强化学习、AGI等技术的发展和应用 风控模型将在数据隐私保护、动态策略优化等方面进一步突破 推动行业向更智能、更精准、更安全的方向发展[7] - 海尔消金坚持科技创新驱动 高度重视风控体系的智能化建设 随着公司AI First战略的持续深化 公司将更全面、更广泛地拥抱AI技术 持续强化数据治理与技术应用能力 在创新与风险平衡中实现信贷业务高质量发展[6][7] 行业认可 - 公司风控模型团队主创的“新时代人工智能背景下的信贷风控模型体系变革研究”项目 入选中国金融传媒评选的“转型成果综合评价实践案例” 公司综合AI风控技术实力得到行业权威认可[6]
港理工成立人工智能高等研究院 聚焦去中心化AI与成果转化
21世纪经济报道· 2025-12-10 20:07
香港理工大学成立人工智能高等研究院(PAAI) - 香港理工大学于12月10日正式成立人工智能高等研究院(PAAI),该研究院是理大未来重点布局的五大高等研究院之一,致力于开展跨学科基础研究并推动成果转化 [1] - 研究院将充分发挥理大在内地的科研网络优势,着力将前沿科研成果转化为现实的产品、技术与标准,服务社会发展 [1] 香港政府的人工智能发展策略 - 香港特区政府创新科技及工业局局长表示,特区政府正从人才、数据及应用等多方面推进香港人工智能发展,并计划于2026年成立香港人工智能研发院(AIRDI),以完善本地AI生态系统 [1] - 在特区政府相关项目的支持下,香港已汇聚全球超过1000名AI与机器人领域的专家 [1] PAAI的发展愿景与研究方向 - PAAI的成立旨在应对当前人工智能发展面临的算力集中化、数据隐私难保障等多重瓶颈 [1] - 研究院确立了“从集中式走向去中心化、从通用走向深度行业应用”的发展愿景,重点研发新一代分布式与去中心化AI架构 [1] - PAAI将持续推进协作式生成AI(Co-GenAI)、联邦学习与边缘基础模型等关键技术的研发 [2] 应对AI核心挑战的技术路径 - 针对“数据孤岛”与“隐私安全”挑战,PAAI创院院长指出未来AI发展方向应是构建连接的“垂直领域专家模型”,而非依赖单一巨型模型 [2] - “联邦学习”作为一种安全、去中心化的人工智能开发方式,能够在不交换原始数据的前提下有效打破医疗与金融领域的数据流通壁垒及破解隐私保护难题 [2] - 围绕“去中心化AI”愿景,PAAI团队实现了端到端的FP8低比特训练技术,仅需一半的算力与存储资源即可构建比肩世界顶尖水平的模型 [3] 重点应用领域布局 - PAAI将在医疗、教育、金融与机器人等重点领域构建稳定的技术布局 [2] - PAAI正与多家医疗机构合作推进“癌症GenAI”项目落地,同时探索AI在传染病防控、机器人系统及金融等领域的应用潜力 [2] - 作为国际金融中心与科创中心,香港背靠粤港澳大湾区丰富的临床网络与产业需求,未来将着力构建去中心化AI基础设施,推动各类机构在安全可控的前提下运用先进AI技术 [2] 项目进展与支持 - Co-GenAI项目已获得香港特区政府“产学研1+计划”(RAISE+)及“主题研究计划”(TRS)的双重资助 [3] - PAAI发布了基于区块链的全球科研协作平台,以期连接全球科研人员,共同构建世界顶尖的科学基础模型 [3]