Workflow
联邦学习
icon
搜索文档
不共享数据,也能联合训练,UCL团队用联邦学习重塑血液形态学检查
36氪· 2026-02-13 17:55
研究核心成果 - 伦敦大学学院研究团队提出名为“MORPHFED”的联邦学习框架,用于白细胞形态分析,使各机构能在不交换原始训练数据的情况下进行协同训练 [1][2] - 该联邦模型利用来自多个临床站点的血液涂片数据,在保证完全数据隐私的同时,学习到稳健且域不变的特征表示 [1][2] - 与集中式训练相比,联邦训练在跨站点性能和对未知机构的泛化能力上表现出色 [1][2][5] 研究背景与挑战 - 血液形态学检查是诊断白血病、贫血等血液疾病的重要环节,但过程劳动强度大且高度依赖专家,在低收入和中等收入国家尤其面临专家稀缺的挑战 [1] - AI模型为自动化血液学诊断提供潜力,但面临数据异质性(染色方法、成像设备差异)导致的泛化能力下降,以及医疗数据隐私限制带来的跨机构数据共享难题 [2] 数据集与实验设计 - 研究使用了来自两个医疗中心的数据集,包含11种共同细胞类型,总计Client 1 (JHH) 21,200张图像和Client 2 (MUH) 8,985张图像,保留了染色和成像差异以测试异质环境下的泛化能力 [5][6] - 保留了来自巴塞罗那临床医院(Client 3)的12,992张图像作为独立外部验证集,用于测试模型在完全未见过机构数据上的表现 [8] - 研究采用了两类深度学习架构:ResNet-34和DINOv2-Small,并对比了四种联邦聚合策略:FedAvg、FedMedian、FedProx、FedOpt [9][12] 模型性能评估 - 在联合测试集评估中,联邦学习显著提升了性能,相比仅使用单个机构数据训练的模型(58% vs 52% 平衡准确率)[16] - 联邦模型的性能略低于对所有数据进行集中训练的模型,但在保持完整数据隐私的同时,仍能达到可比精度 [16] - 在外部分布数据泛化评估中,联邦方法(FedMedian和FedOpt)在完全未见过的Client 3数据上的泛化能力优于集中式训练(平衡准确率 67% vs 64%)[17][18] - FedMedian在少数类细胞识别上提升显著,例如带状中性粒细胞F1分数为0.62,相比集中式的0.30提升107%;早幼粒细胞F1分数为0.61,相比集中式的0.35提升74% [19] 联邦学习的行业意义与应用 - 联邦学习是一种“数据不出域、模型可协作”的协同机器学习范式,能有效保护数据隐私并满足严格的数据合规要求,成为破解医疗“数据孤岛”的关键技术 [20][21] - 在医疗影像领域,联邦学习使得不同医院能够在不共享原始影像数据的情况下联合训练模型,从而提升模型对不同设备、协议和患者群体的泛化能力 [21] - 已有公司如Owkin在推进联邦学习在医疗行业的应用,并开源了联邦学习软件Substra,用于临床研究和药物研发 [20][21] - 联邦学习所代表的“分布式协同智能”模式,正在成为未来医疗AI规模化部署的重要基础设施,为隐私保护型医学大模型的训练提供了可行路径 [22]
中移取得联邦学习方法系统和存储介质专利
搜狐财经· 2026-02-03 15:00
中国移动集团及子公司获得联邦学习专利 - 中国移动通信集团有限公司及其两家子公司(中移(上海)信息通信科技有限公司、中移智行网络科技有限公司)共同获得一项名为“联邦学习方法、系统和存储介质”的专利,授权公告号为CN116090586B,该专利的申请日期为2021年11月 [1] 中移(上海)信息通信科技有限公司概况 - 公司成立于2018年,位于上海市,主营业务为科技推广和应用服务业,企业注册资本为200,000万人民币(即200亿人民币)[1] - 公司参与招投标项目2,020次,拥有商标信息34条,专利信息953条,以及行政许可6个 [1] 中移智行网络科技有限公司概况 - 公司成立于2015年,位于上海市,主营业务为软件和信息技术服务业,企业注册资本为100,000万人民币(即100亿人民币)[1] - 公司参与招投标项目705次,拥有商标信息106条,专利信息861条,以及行政许可8个 [1] 中国移动通信集团有限公司概况 - 公司成立于1999年,位于北京市,主营业务为电信、广播电视和卫星传输服务,企业注册资本为30,000,000万人民币(即3,000亿人民币)[2] - 公司共对外投资了55家企业,参与招投标项目5,000次,拥有商标信息2,211条,专利信息5,000条,以及行政许可50个 [2]
爱尔眼科参与起草《优化消费环境 放心消费品牌评价规范》
搜狐财经· 2026-01-27 10:53
行业标准与规范 - 2025年1月24日,品牌强国经济论坛在北京举行,会上正式启动了《优化消费环境 放心消费品牌评价规范》团体标准的宣贯工作 [1] - 该标准由全国商报联合会联合国家市场监督管理总局发展研究中心、对外经济贸易大学中国国际品牌战略研究中心等权威机构牵头起草 [1] - 标准构建了涵盖经营基本情况、消费环境创建、质量安全放心、消费者权益保护、消费服务保障、诚信信用、社会责任等多维度的完整评价指标体系,旨在为行业规范化发展与放心消费品牌建设提供科学指引 [1] - 公司作为该标准的起草单位之一,将自身在眼科医疗服务领域二十余年的发展经验融入标准制定中,助力消费环境优化与放心消费生态构建 [1] 公司业务模式与网络 - 公司针对医疗资源分配不均的问题,创造了适应国内市场的分级连锁模式,打造“横向成片、纵向成网”的立体化眼科服务网络,推动优质医疗资源共享下沉 [2] - 公司以“共享全球眼科智慧”为目标加速国际化,已基本实现医疗技术、设备、药品与国际水平的“三同步”,旨在让创新技术更早惠及中国患者 [2] 医疗质量与安全管理 - 医疗质量与安全管理是公司发展的核心驱动力,公司通过健全质量管理体系、完善制度规范、强化风险防控、推进智能监管等举措,不断完善集团化医疗高质量管理体系 [2] - 公司在门诊量、手术量、出院人次稳健增长的同时,质控成绩突出,例如2024年,角膜移植术、玻切术等高等级手术的术后感染性眼内炎发生率低至0.0156%,优于国际平均水平 [2] 技术创新与数字化转型 - 公司加速推进眼科医疗数字化转型,首创“数字眼科”发展新模式 [3] - 公司在人工智能、大语言模型、联邦学习等前沿技术领域持续发力,全面打造“爱尔AI数字眼科医院”,旨在实现眼健康服务全流程的智能闭环管理 [3] - 公司致力于将人工智能的高水平服务普及到全生命周期的眼健康医疗服务中,以提升医疗服务的精准性、可及性与效率,惠及更多基层患者 [3] 未来发展规划 - 未来,公司将以《优化消费环境 放心消费品牌评价规范》团体标准为重要指引,持续深化技术创新,迭代升级服务品质 [3] - 公司致力于以专业力量守护患者光明福祉,为推动中国眼科行业高质量发展、构筑放心医疗消费生态贡献力量 [3]
医渡科技宫如璟达沃斯之行:密集开展国际对话,释放AI医疗价值与全球合作战略
搜狐财经· 2026-01-26 16:01
公司动态与全球参与 - 医渡科技创始人、董事长宫如璟女士应邀出席世界经济论坛第56届年会(冬季达沃斯论坛),参与多场高级别行业对话、闭门会议,并密集会见了全球政商学界领袖与合作伙伴 [1] - 会议期间,宫如璟女士与香港特区政府财政司司长陈茂波、港交所董事会主席唐家成进行了交流,介绍了公司发展近况 [7] - 宫如璟女士与诺华、正大集团、西门子医疗等多家企业高管就AI医疗落地、药物研发赋能、行业趋势研判等潜在合作方向深入交换意见 [7] - 宫如璟女士接受了CCTV、CGTN、彭博社等多家国内外重要媒体的采访,阐述了公司通过人工智能技术助力医疗行业智能化转型的探索与成果 [7] 行业洞察与公司观点 - 气候变化正以“渐进渗透”与“突发冲击”双重方式影响全球疾病负担,催生新的健康挑战与市场需求 [1] - AI医疗企业可依托人工智能等技术,助力监测气候敏感疾病趋势、加强公共卫生预警、创新慢性病管理模式,从而系统提升社会健康韧性 [1] - 真正的健康安全不仅依赖全球协同的数据基础设施,更需扎根本地的技术共建与可持续能力培育 [3] - 中国AI医疗凭借丰富的应用场景、日益完善的数据生态和有力的政策支持,已形成独特的发展优势 [5] - 中国经验的全球价值不仅体现在技术突破上,更在于系统化的工程落地能力与高效的本地化适配模式 [5] - 呼吁国际社会加强在伦理标准互认、跨国联合研究以及长期资本与人才流动等方面的协作,共同构建可信、可持续的全球医疗AI生态 [5] 技术实践与解决方案 - 公司正通过联邦学习等隐私计算技术,在保障数据安全的前提下,提升跨区域模型的训练效率与算法普适性 [3] - 在文莱,公司已将大流行期间构建的应急平台转化为国家级健康管理应用“BruHealth”,实现对慢性病的规模化主动管理 [3] - 该平台已覆盖文莱85%以上人口,深度融入民众日常健康管理,成为该国全民健康体系的核心数字支撑 [3] 战略合作与项目进展 - 诺华公司董事会主席Giovanni Caforio博士在达沃斯宣布,诺华基金会、文莱卫生部与医渡科技旗下EVYD公司将联合实施数智驱动的心血管疾病防控项目“CARDIO4Cities” [7]
【全网无错版】上周末,唐杰、杨强、林俊旸、姚顺雨真正说了什么?
机器人圈· 2026-01-13 17:41
文章核心观点 文章记录了2026年初中国AI领域一场汇聚顶尖学者与产业界核心人物的圆桌讨论,探讨了中国大模型行业的发展分化、AGI的下一个技术范式、Agent战略以及中国AI的未来前景[1][6]。核心观点认为,中国AI行业在经历了2025年开源模型的爆发式增长后,正进入一个关键的分化与战略选择期,行业需从追随转向引领,通过聚焦特定方向、探索新范式、发展Agent应用并改善创新环境,以在全球竞争中占据领先地位[6][22][57][70]。 话题1:中国大模型将如何分化? - **市场出现To C与To B的明显分化**:ChatGPT和Claude Code分别被视为To C和To B的典范。To C应用对智能强度的需求增长放缓,而To B应用则因智能直接关联生产力,对最强模型有明确的付费意愿溢价[8][9][10][11]。 - **技术路径出现垂直整合与模型应用分层分化**:在To C场景,模型与产品强耦合的垂直整合模式依然有效(如ChatGPT、豆包)。但在To B生产力场景,趋势是模型层与应用层分离,强大的基座模型被多样化的应用层产品所利用[12]。 - **企业战略分化基于自身基因与数据优势**:腾讯作为To C基因强的公司,其瓶颈在于为模型提供更多上下文(Context)和环境(Environment),而非单纯追求模型规模[13][14]。大公司可利用其内部多样化的真实场景数据来训练模型,这相比依赖外部数据标注商能获得独特优势[15]。 - **分化是自然演进与客户需求驱动的结果**:行业分化并非完全预设,而是在与客户频繁交流中自然发现机会(如Anthropic聚焦Coding和Finance),中国SaaS市场环境与美国不同也影响了分化路径[17][18]。 - **学术界与工业界的分化与协作**:工业界在资源投入上主导发展,学术界应跟进解决基础科学问题,如智能上界、资源分配效率、哥德尔不完备定理下的幻觉消除极限等[19][20]。 话题2:AGI的下一个范式 - **自主学习(Self-learning)成为硅谷共识与热点方向**:该方向已被广泛讨论,但其具体形态因场景和奖励函数不同而多样,例如聊天个性化、编码环境适应、科学探索等[23]。 - **自主学习已在特定场景下以渐变形式发生**:例如ChatGPT利用用户数据优化聊天风格,Claude Code项目95%的代码由自身编写以实现自我改进,这被视为一种特定场景下的AGI体现[24]。 - **新范式的瓶颈在于想象力与评估标准**:实现突破的关键条件可能已部分具备(如Cursor的模型利用实时用户数据更新),但更大的挑战是如何定义和验证“实现了自我学习”的成功标准[25][26]。 - **OpenAI仍被视为最有可能引领新范式的公司**,尽管其商业化可能削弱了部分创新基因[26]。 - **强化学习(RL)的潜力尚未充分释放**:RL的计算规模(Compute)尚未充分扩展,仍存在基础设施(Infra)问题,其潜力有待进一步挖掘[27]。 - **Task-time Scaling(任务时间缩放)与主动性(Active Learning)是关键探索方向**:让AI在单次任务中通过消耗更多计算时间(Token)变得更强,以及让AI能根据环境信号自主启动并规划任务,是重要的范式候选,但伴随安全担忧[27][28]。 - **个性化(Personalization)可能是自主学习早期落地的场景**,但如何衡量AI时代的个性化效果成为新的技术挑战[29][30]。 - **记忆(Memory)技术的突破可能是线性发展后的感知临界点**:技术本身线性发展,但当记忆能力达到某个临界点,用户体验可能发生跃迁,类似电影《Her》中的效果,这可能需要一年左右时间[31]。 - **联邦学习(Federated Learning)代表的协作范式前景广阔**:通过“多个中心协作”模式,能结合通用大模型与本地专业化模型,在医疗、金融等隐私要求高的领域具有应用潜力[34]。 - **2026年出现新范式变革的驱动力增强**:学术界算力资源提升使其具备创新基础;工业界持续投入的边际效率下降,催生对“智能效率”(Intelligence Efficiency)提升新范式的需求[35][36][37]。 话题3:Agent战略 - **To B的Agent已进入价值上升曲线**:Anthropic的路径表明,在To B领域,模型智能提升与解决任务数量、商业收入增长高度一致,使得生产力Agent的发展势头强劲[41]。 - **当前Agent发展的两大瓶颈是环境部署与用户教育**:即使模型能力停滞,通过更好部署到各行业也能带来巨大经济收益(潜在影响GDP 5%~10%,目前远低于1%)。同时,会使用AI工具的人与不会使用的人之间的能力差距正在拉大,教育至关重要[41][42]。 - **产品哲学趋向“模型即产品”(Model as a Product)或“研究即产品”(Research as a Product)**:成功的Agent产品(如Manus)以及OpenAI的模式显示,研究员端到端地将研究转化为产品是重要趋势[43]。 - **未来的Agent将是“托管式”且与自我进化、主动学习强相关**:能够执行长时间、通用任务的Agent,需要在任务过程中自我进化并主动决策,这对模型能力提出更高要求[44]。 - **Agent的终极潜力在于与复杂物理环境交互**:超越电脑环境,指挥机器人进行湿实验等操作,才能实现自动化人类更长时间工作流的愿景,这可能需3-5年并与具身智能结合[45][46]。 - **通用Agent的机会在于解决长尾需求**:与推荐系统类似,解决海量个性化、非标的长尾问题是AI和通用Agent的核心魅力与挑战所在[46][47]。 - **强化学习(RL)降低了修复模型问题的难度**:相比以前,现在只需少量查询(Query)和奖励(Reward)数据,就能通过RL快速优化模型在特定问题上的表现[48][49]。 - **Agent将经历从人工定义到内生自动化的四个阶段**:从当前目标与规划皆由人定义,最终发展为目标和规划均由大模型自主定义的内生(Native)系统[51][52]。 - **Agent成功的三要素是价值、成本与速度**:需解决有真实价值的问题、控制实现成本,并在快速迭代的时间窗口内建立优势[54][55]。 话题4:中国AI的未来 - **中国在技术追赶和工程复现方面具备强大能力**:一旦技术路径被证明可行,中国团队能快速跟进并在局部做到更好,制造业和电动车已有先例[57]。 - **突破新范式需要更多冒险精神与前沿探索**:中国拥有大量顶尖人才,但相较于美国,愿意从事高风险、探索性前沿研究的人可能还不够多,这受经济、商业环境和文化因素影响[58]。 - **研究文化更倾向于做确定性高和看重榜单排名**:国内研究更聚焦已被验证的路径(如预训练),对探索性方向(如长期记忆)相对谨慎。同时,相较于海外更注重实际体验(如Claude的实用性),国内有时对刷榜数字看得更重[60][61]。 - **算力资源分配存在差距,但可能催生“穷则思变”的创新**:美国在用于下一代研究的计算资源上领先中国1-2个数量级,中国大量算力用于产品交付。资源紧张可能反而激励算法与基础设施的联合优化等效率创新[62][63][64]。 - **年轻一代冒险精神增强与营商环境改善是积极信号**:90后、00后的冒险精神更强,结合中国营商环境的持续改善,为创新提供了可能[65][70]。 - **对中国团队3-5年内成为全球AI领导者的概率判断存在分歧**:林俊旸认为概率低于20%,主要因历史积淀和算力差距[66]。姚顺雨表示乐观,认为关键在于能否引领新范式[57][58]。杨强回顾互联网发展,认为中国在应用层面,尤其是To C领域,有望百花齐放并领先[66][68]。 - **成功的关键条件包括人才、环境与坚持**:需要敢于冒险的聪明人、更有利于创新的营商环境(减少交付压力、鼓励竞争),以及从业者在选定的道路上笨拙而持久的坚持[69][70][71]。
联邦学习不再安全?港大TPAMI新作:深挖梯度反转攻击的内幕
机器之心· 2026-01-11 12:00
文章核心观点 - 联邦学习作为隐私保护的协同训练范式,其安全性因梯度反转攻击而面临严峻挑战,攻击者可能仅凭共享的梯度信息重建客户端的私有训练数据[3][5] - 一项由多所大学合作发表在IEEE TPAMI上的研究,首次对梯度反转攻击进行了系统性分类、理论分析和实验评测,并提出了实用的三阶段防御指南[3][6][24] 梯度反转攻击的方法分类 - 基于优化的攻击:通过迭代优化虚拟数据,使其梯度与真实梯度距离最小化,代表方法有DLG、Inverting Gradients等[10][12] - 基于生成的攻击:利用预训练的生成模型作为先验来生成近似输入数据,可细分为优化隐向量、优化生成器参数或训练逆向生成模型[10][12] - 基于分析的攻击:利用模型层的线性特性,通过解析解直接恢复输入数据,通常需要恶意服务器修改模型架构或参数[10][12] 理论突破 - 定理1:首次从理论上证明了基于优化的攻击的重建误差与批量大小和图像分辨率的平方根呈线性关系,即批量越大、分辨率越高,攻击难度越大[11] - 命题1:揭示了模型训练状态对攻击的影响,当不同数据的梯度越相似时,攻击恢复数据的难度就越大[13] 实验发现与关键结论 - 实验在CIFAR-10/100、ImageNet、CelebA等数据集上进行,覆盖了ResNet、ViT及LoRA微调场景[15] - 基于优化的攻击最实用且无额外依赖,但其效果受批量大小和分辨率限制,且在实用的多步本地训练场景下威胁被大幅削弱[25] - 基于生成的攻击能生成高质量图像,但严重依赖预训练生成器、辅助数据集或特定的Sigmoid激活函数,条件不符时易失效[25] - 基于分析的攻击可实现精准数据恢复,但因需修改模型而容易被客户端检测,实践中难以得逞[25] - 在LoRA微调大模型的场景中,攻击者可恢复低分辨率图像,但在高分辨率上常失败,且预训练模型越小,隐私泄露风险越低[25] 防御指南 - 网络设计阶段:避免使用Sigmoid激活函数,采用更复杂的网络架构以增加优化难度[22][26] - 训练协议阶段:增大批量大小以混淆梯度,并采用多步本地训练来破坏梯度的直接对应关系[22][26] - 客户端校验阶段:客户端在接收服务器下发的模型时,应校验模型架构和参数,防止被植入恶意模块[22]
海尔消费金融2025年“特征英雄”落下帷幕,数智化风控质效显著
搜狐财经· 2026-01-06 15:50
公司近期活动与成果 - 海尔消金2025年“特征英雄”活动圆满收官 该活动旨在激发全员坚持数据科学驱动理念 深度挖掘金融服务场景中数据驱动的核心价值 扩充多维数据样本并验证数据特征核心优势[1] - 活动共吸引32名员工参与 从海量数据中挖掘出2023个高质量特征 相当于为风控系统增添了2023个新工具与新视角[5] - 2025年公司智能风控系统累计上线实时特征达10,427个 同比大幅增加70%[6] - 公司通过举办此类竞赛活动 激发全员拥抱AI的热情 强化数据驱动理念 挖掘数据资产 拓展特征来源和衍生技术 以服务实际业务并持续输出落地价值[6] 风控技术应用与创新 - 公司利用大模型替代人工对语音数据进行批量处理 提取有效信息用于信贷模型研发 以降低信用风险[5] - 公司挖掘信贷场景中时序特征的潜在价值 突破传统“静态快照”局限 利用RNN、Transformer等序列模型解析用户信息时序数据 精准识别“以贷养贷”行为以阻断风险传导[5] - 通过使用多模态大模型 提升了意图识别和风险判定的精度 能精准捕捉“还款困难”等语义特征[5] - 智能预警模型使早期风险识别效率提升10% 为信贷业务安全稳定开展提供保障[5] - 公司将AI深度嵌入全流程风控系统 既大幅降低了欺诈风险 又有效提升了信贷审批效率 形成“风险可控、服务高效”的双重优势[6] 行业趋势与公司战略 - 在数字经济与金融科技深度融合的背景下 以大模型、图学习、自然语言处理为代表的深度学习技术的成熟和普及 对信贷风控模型产生了颠覆性影响 行业呈现出多种人工智能技术融合应用的趋势[6] - 未来 随着联邦学习、强化学习、AGI等技术的发展和应用 风控模型将在数据隐私保护、动态策略优化等方面进一步突破 推动行业向更智能、更精准、更安全的方向发展[7] - 海尔消金坚持科技创新驱动 高度重视风控体系的智能化建设 随着公司AI First战略的持续深化 公司将更全面、更广泛地拥抱AI技术 持续强化数据治理与技术应用能力 在创新与风险平衡中实现信贷业务高质量发展[6][7] 行业认可 - 公司风控模型团队主创的“新时代人工智能背景下的信贷风控模型体系变革研究”项目 入选中国金融传媒评选的“转型成果综合评价实践案例” 公司综合AI风控技术实力得到行业权威认可[6]
港理工成立人工智能高等研究院 聚焦去中心化AI与成果转化
21世纪经济报道· 2025-12-10 20:07
香港理工大学成立人工智能高等研究院(PAAI) - 香港理工大学于12月10日正式成立人工智能高等研究院(PAAI),该研究院是理大未来重点布局的五大高等研究院之一,致力于开展跨学科基础研究并推动成果转化 [1] - 研究院将充分发挥理大在内地的科研网络优势,着力将前沿科研成果转化为现实的产品、技术与标准,服务社会发展 [1] 香港政府的人工智能发展策略 - 香港特区政府创新科技及工业局局长表示,特区政府正从人才、数据及应用等多方面推进香港人工智能发展,并计划于2026年成立香港人工智能研发院(AIRDI),以完善本地AI生态系统 [1] - 在特区政府相关项目的支持下,香港已汇聚全球超过1000名AI与机器人领域的专家 [1] PAAI的发展愿景与研究方向 - PAAI的成立旨在应对当前人工智能发展面临的算力集中化、数据隐私难保障等多重瓶颈 [1] - 研究院确立了“从集中式走向去中心化、从通用走向深度行业应用”的发展愿景,重点研发新一代分布式与去中心化AI架构 [1] - PAAI将持续推进协作式生成AI(Co-GenAI)、联邦学习与边缘基础模型等关键技术的研发 [2] 应对AI核心挑战的技术路径 - 针对“数据孤岛”与“隐私安全”挑战,PAAI创院院长指出未来AI发展方向应是构建连接的“垂直领域专家模型”,而非依赖单一巨型模型 [2] - “联邦学习”作为一种安全、去中心化的人工智能开发方式,能够在不交换原始数据的前提下有效打破医疗与金融领域的数据流通壁垒及破解隐私保护难题 [2] - 围绕“去中心化AI”愿景,PAAI团队实现了端到端的FP8低比特训练技术,仅需一半的算力与存储资源即可构建比肩世界顶尖水平的模型 [3] 重点应用领域布局 - PAAI将在医疗、教育、金融与机器人等重点领域构建稳定的技术布局 [2] - PAAI正与多家医疗机构合作推进“癌症GenAI”项目落地,同时探索AI在传染病防控、机器人系统及金融等领域的应用潜力 [2] - 作为国际金融中心与科创中心,香港背靠粤港澳大湾区丰富的临床网络与产业需求,未来将着力构建去中心化AI基础设施,推动各类机构在安全可控的前提下运用先进AI技术 [2] 项目进展与支持 - Co-GenAI项目已获得香港特区政府“产学研1+计划”(RAISE+)及“主题研究计划”(TRS)的双重资助 [3] - PAAI发布了基于区块链的全球科研协作平台,以期连接全球科研人员,共同构建世界顶尖的科学基础模型 [3]
微软系 40 大 AI 科学家,为何钟情雷峰网的 GAIR 大会?
雷峰网· 2025-11-27 18:05
GAIR大会与微软系科学家的历史渊源 - 1998年张亚勤与李开复联合创办微软中国研究院,被称为中国人工智能的黄埔军校[5] - 2016年首届GAIR大会在深圳举办,由CCF和雷峰网主办,旨在促进学术界、产业界、投资界融合[7][8] - 七年来GAIR已成为微软系科学家的AI第二故乡,累计有40多名来自微软全球各地的科学家参与[9] 历届GAIR大会的重要里程碑 - 2018年第三届GAIR上微软系马毅、孙剑探讨深度学习的痼疾[9] - 2019年第四届GAIR上张正友、周明分别作为CVPR、ACL大会主席探讨人工智能多学科大一统[9] - 2020年第五届GAIR设立纪念Thomas Huang专场,沈向洋、颜水成、田奇等参与追忆[9] - 2023年第七届GAIR成为国内首个走向海外的AI产学融合顶会,黄学东院士离开微软后首秀[9] - 2025年12月将举办第八届GAIR全球人工智能与机器人大会[10] 微软系顶尖科学家的职业发展轨迹 - 沈向洋从微软全球执行副总裁转任IDEA理事长、香港科技大学校董会主席[14] - 黄学东从微软云与人工智能部首席AI技术官加入Zoom担任CTO[17] - 张宏江从微软亚太研发集团CTO转任北京智源人工智能研究院理事长[20] - 周明从微软亚洲研究院副院长孵化出澜舟科技,推出轻量化模型"孟子"[36] - 马维英从微软亚洲研究院常务副院长加入字节跳动,后转入张亚勤清华AIR团队[40] - 何晓冬从微软雷德蒙德研究院负责人转任京东集团高级副总裁、大模型负责人[46] 科学家在GAIR大会的技术分享重点 - 杨强在2016、2019、2020年分别分享人工智能成功条件、联邦学习发展及应用[22][23] - 孙剑在2017-2019年连续三届分享Face++研发方向、云端芯视觉计算、深度学习变革[50] - 颜水成在2017、2020年探讨深度学习精度极限与用户体验、芯片能与新基建[56] - 梅涛在2017-2021年分享视频内容生命周期、智能供应链机器视觉、感知到认知计算[60] - 郑宇在2019年演讲用大数据和AI打造智能城市[58] 科学家在产业界的技术影响力 - 张正友现任腾讯首席科学家,曾在GAIR分享计算机视觉三生三世[32] - 芮勇现任联想集团CTO,曾在GAIR分享计算机视觉从感知到认知的长征[34] - 赵峰现任清华大学AIR首席科学家,曾在GAIR分享IoT+AI赋能智慧家庭[42] - 华先胜曾任阿里巴巴副总裁,现任特斯联CTO,专注城市大脑视觉智能[54] - 余凯从百度研究院副院长创办地平线,在GAIR分享中国AI真实现状[72]
AAAI 2026 Oral | 悉尼科技大学联合港理工打破「一刀切」,联邦推荐如何实现「千人千面」的图文融合?
机器之心· 2025-11-25 12:09
行业痛点与现有挑战 - 推荐系统利用图像和文本等多模态信息辅助决策已成为标配,但该需求与要求“数据不出本地”的联邦学习范式结合时情况变得复杂[2] - 现有联邦推荐方法面临两难:为保护隐私而放弃繁重多模态处理仅使用ID特征,或采用“一刀切”的粗暴融合策略假设所有用户图文偏好一致[2] - 用户对图文信息的“融合偏好”具有极大异质性,例如购买服装更依赖视觉冲击,挑选数码产品则更关注参数文本,这种差异在联邦环境下极难捕捉[2] - 联邦学习中存在“信息不对称”问题,服务器看不见用户行为数据,无法得知个体用户对图片或文字的偏好程度[5] - 端侧设备算力有限,难以运行庞大的视觉-语言模型(如CLIP),构成计算瓶颈[5] 核心技术框架:FedVLR - FedVLR核心洞见在于重构多模态融合决策流,将重计算的特征预处理留给服务器,而将决定“怎么看”的融合决策权通过轻量级路由机制下放给用户端侧[3] - 该框架创新性地提出双层融合机制,巧妙解耦特征提取与偏好融合[8] - 第一层为服务器端的“多视图预融合”,利用强大预训练模型将物品图像、文本和ID信息通过多种预设融合算子加工成一组“候选融合视图集”,解决算力焦虑[9] - 第二层为客户端的“个性化精炼”,引入极轻量的本地混合专家模块,利用本地私有交互历史动态计算个性化权重,实现千人千面[11] - 融合过程完全在本地发生,确保用户偏好数据从未离开设备,严格遵循隐私保护原则[12] 技术优势与工程价值 - FedVLR被设计为可插拔的通用增强方案,具有极高工程落地价值[15] - 具备模型无关性,可无缝挂载到FedAvg、FedNCF等任何主流基于ID的联邦推荐框架上[16] - 实现零通信增量,通信过程中传输的依然是梯度或小模型参数,未增加额外带宽负担[16] - 隐私无损且低端侧开销,复杂CLIP编码在云端完成,端侧仅需运行轻量级MLP路由网络[16] - 在电商、多媒体等多个领域公开数据集上的测试表明,无论基线模型如何,挂载FedVLR后NDCG和HR等核心推荐指标均实现显著且稳定提升[17][26] 应用前景与行业影响 - FedVLR为联邦基础模型落地提供了极具启发性的范式,展示了“云端大模型编码+端侧微调适配”的高效协同路径[19] - 该方案无需在每个终端部署庞大模型,通过精巧架构设计将云端通用内容理解能力与端侧私有偏好解耦[19] - 极大降低了联邦学习的通信与计算门槛,为未来将更复杂视觉-语言模型甚至生成式AI引入隐私敏感场景铺平道路[19] - 在数据稀疏场景下性能提升尤为显著,证明通过个性化融合策略能更有效利用有限本地数据理解物品内容[26] - 是构建下一代“既懂内容、又懂用户、且严守隐私边界”的智能系统的关键一步[19]