一、联邦学习的定义

横向联邦学习和纵向联邦学习要求所有的参与方具有相同的特征空间或样本空间,从而建立起一个有效的共享机器学习模型。然而,在更多的实际情况下,各个参与方所拥有的数据集可能存在高度的差异,例如:参与方的数据集之间可能只有少量的重叠样本和特征,并且这些数据集的规模与分布情况可能差别很大,此时横向联邦学习与纵向联邦学习就不是很适合了。

在这种情况下,通过迁移学习技术,使其可以应用于更广的业务范围,同时可以帮助只有少量数据(较少重叠的样本和特征)和弱监督(较少标记)的应用建立有效且精确的机器学习模型,并且遵守数据隐私和安全条例的规定。这种组合即称为联邦迁移学习(FTL),它可以处理超出现有横向联邦学习和纵向联邦学习能力范围的问题。

一个联邦迁移学习系统一般包括两方,称为源域和目标域。一个多方的联邦迁移学习系统可以被认为是多个两方联邦迁移学习系统的结合。

二、联邦迁移学习的分类

基于实例的联邦迁移学习

对于横向联邦学习,参与方的数据通常来自不同的分布,这可能会导致在这些数据上训练的机器学习模型的性能较差。参与方可以有选择地挑选或者加权训练样本,以减小分布差异,从而可以将目标损失函数最小化。对于纵向联邦学习,参与方可能具有非常不同的业务目标。因此,对齐的样本及其某些特征可能对联邦迁移学习产生负面影响,这被称为负迁移。在这种情况下,参与方可以有选择地挑选用于训练的特征和样本,以避免产生负迁移。

基于特征的联邦迁移学习

参与方协同学习一个共同的表征空间。在该空间中,可以缓解从原始数据转换而来的表征之间的分布和语义差异,从而使知识可以在不同领域之间传递。对于横向联邦学习,可以通过最小化参与方样本之间的最大平均差异来学习共同的表征空间。对于纵向联邦学习,可以通过最小化对齐样本中属于不同参与方的表征之间的距离,来学习共同的表征空间。

基于模型的联邦迁移学习

参与方协同学习可以用于迁移学习的共享模型,或者参与方利用预训练模型作为联邦学习任务的全部或者部分初始模型。横向联邦学习本身就是一种基于模型的联邦迁移学习,因为在每个通信回合中,各参与方会协同训练一个全局模型,并且各参与方把该全局模型作为初始模型进行微调。对于纵向联邦学习,可以从对齐的样本中学习预测模型或者利用半监督学习技术,以推断缺失的特征和标签,然后,可以使用扩大的训练样本训练更准确的共享模型。

三、联邦迁移学习算法

3.1、联邦迁移学习的训练过程

种联邦迁移学习算法训练过程包含以下几个步骤:

●  步骤一:

A方:在本地运行神经网络 ,以获得数据的隐藏表征  ;

B方:在本地运行神经网络 ,以获得数据的隐藏表征  ;

●  步骤二:

A方:计算和加密一组中间结果,设为 ,并将其发送给B方,以帮助计算梯度 

B方:计算和加密一组中间结果,设为  和 ,并发送给A方,以帮助计算梯度 和损失L;

●  步骤三:

A方:基于收到的  和 ,通过式  和  计算得到  ,之后A方创建随机掩码  并将其添加至  以得到  ,A方向B方发送  和  ;

B方:基于收到的 ,通过  计算得到 。之后,B方创建随机掩码  并将其添加至  以得到  ,B方向A方发送

●  步骤四:

A方:解密得到 ,并将其发送给B方;

B方:解密得到  和L,并将它们发回给A方。

●  步骤五:

A方:去掉随机掩码并获得梯度  ,之后,使用自己的梯度来更新自己的模型;

B方:去掉随机掩码并获得梯度  ,之后,使用自己的梯度来更新自己的模型。

●  步骤六:

一旦损失L收敛,A方向B方发送终止信号,否则就前往步骤一以继续训练过程。

3.2、联邦迁移学习的预测过程

一旦联邦迁移学习模型训练完毕,它便能用于预测B方中的未标注数据。对于未标注数据样本的预测过程,步骤如下:

●  步骤一:

B方用已训练好的神经网络参数  计算 ,并给A方发送加密过的

●  步骤二:

A方评估  并用随机值对结果进行掩藏,并将加密和掩藏过的  发送给B方。

●  步骤三:

B方解密  并将  发送给A方。

●  步骤四:

A方获得 ,进而得到标签 ,并将标签  发送给B方。

四、基于秘密共享的联邦迁移学习

4.1、基于秘密共享的联邦迁移学习的训练过程

对于基于秘密共享的联邦迁移学习的训练过程,步骤如下:

●  步骤一:

A方和B方在本地运行各自的神经网络 ,以获得数据的隐藏表征  和

●  步骤二:

A方和B方通过秘密共享协议共同地计算 。A方计算  并发送给B方,B方计算  并发送给A方。

●  步骤三:

A方和B方通过式  分别重构损失L。

●  步骤四:

A方和B方通过秘密共享协议共同地计算  和

●  步骤五:

A方通过  计算梯度,并更新它的本地模型 。同时,B方通过  计算梯度,并更新它的本地模型

●  步骤六:

一旦损失L收敛,A方给B方发送终止信号。否则,前往步骤一以继续训练过程。

4.2、基于秘密共享的联邦迁移学习的预测过程

在训练结束之后,就可以进入预测阶段,预测过程主要包括两个步骤。

●  步骤一:

A方和B方在本地运行已训练完毕的神经网络 ,以获得数据隐藏表征  和

●  步骤二:

基于  和 ,A方和B方共同地通过秘密共享协议重建  以及计算标签

隐私计算--24--联邦迁移学习相关推荐

  1. 2月份隐私计算、联邦学习的市场概览

    2月份隐私计算.联邦学习的市场概览 摘要:在隐私计算市场中,三股信息流如清风拂面,流转不息.采购意向,犹如花开满园,为供应商和服务提供商探明商机:招标信息,如云卷云舒,为客户了解市场动态提供重要参考: ...

  2. 联邦学习 OR 迁移学习?No,我们需要联邦迁移学习

    2020-11-18 13:40:43 机器之心分析师网络 作者:仵冀颖 编辑:H4O 在这篇文章中,作者通过 4 篇论文详细介绍了联邦学习中的联邦迁移学习问题,并探讨了向经典联邦学习中引入迁移学习的 ...

  3. 【Pytorch神经网络实战案例】24 基于迁移学习识别多种鸟类(CUB-200数据集)

    1 迁移学习 在实际开发中,常会使用迁移学习将预训练模型中的特征提取能力转移到自己的模型中. 1.1 迁移学习定义 迁移学习指将在一个任务上训练完成的模型进行简单的修改,再用另一个任务的数据继续训练, ...

  4. 基于分布式CPU计算的Deeplearning4j迁移学习应用实例

    原帖:  阿里云云栖社区 https://yq.aliyun.com/articles/114669  排版清晰,建议去原帖看 更多深度文章,请关注:https://yq.aliyun.com/clo ...

  5. 隐私计算的介绍-入门学习笔记(一)

    一.隐私权定义为两种: 个人隐私数据的隐私权,与科学数据隐私权,即大数据交易的所有权. 二.隐私计算的范畴及发展范围: 隐私计算是隐私信息的所有权.管理权和使用权分离时隐私度量.隐私泄漏代价.隐私保护 ...

  6. 面向隐私计算的联邦学习激励机制与效率优化研究

    大致是了解了申请项目的全过程,写一份好的申请书,选择合适的课题真的十分重要 科研项目进展 希望能拿到国家级项目 – 好消息是拿国家级了--坏消息是EI即以上一篇论文+专利,未来有学弟看到这篇文章,申请 ...

  7. 隐私计算--联邦学习

    目录 联邦学习 联邦学习系统构架 联邦学习开源框架 联邦学习分类 横向联邦学习 纵向联邦学习 联邦迁移学习 联邦学习特点 参考推荐: 联邦学习概念及应用 https://blog.csdn.net/c ...

  8. 隐私计算 — 联邦学习 — Overview

    目录 文章目录 目录 前言 联邦学习 联邦学习与分布式机器学习的区别 联邦学习的网络拓扑类型 客户端-服务器拓扑 对等网络拓扑 联邦学习的数据分区类型 横向联邦学习 纵向联邦学习 联邦迁移学习(Fed ...

  9. 隐私计算--37--演讲实录:深入浅出谈联邦学习

    一.前言 前段时间受CSDN邀请,为CSDN和易观分析主办的<隐私计算-Meet-up>做隐私计算相关的演讲,最终选题<深入浅出谈联邦学习>,本次分享的内容主要分为三部分,第一 ...

最新文章

  1. “崩溃!我再也不搞 AI 了”谷歌 AI 专家:别让你的方法打败你!
  2. Python入门教程:很多人推荐学 Python 入 IT ,如果学完 Python 找不到工作怎么办...
  3. python如何启动app_Python手机app爬虫|Airtest连接多个手机的时候,如何启动APP-start_app...
  4. Spring 的IOC容器系列的设计与实现:BeanFactory 和 ApplicationContext
  5. PHP ElasticSearch的使用
  6. Docker 容器中“TERM environment variable not set.”问题解决
  7. SAP CRM WebClient UI上note下拉列表里类型的过滤逻辑
  8. GM6 pageset - Cache get scenario /ui2/cl_pfcg_utils
  9. HDU1576(欧几里得算法)
  10. 论文浅尝 | ICLR2020 - 基于组合的多关系图卷积网络
  11. 《软件需求分析(第二版)》第 4 章——需求分析员的职责 重点部分总结
  12. 明锐旅行车又大又便宜,值得买吗?
  13. uvalive 3938 Ray, Pass me the dishes! 线段树 区间合并
  14. oracle扩容临时表空间,oracle临时表空间扩容
  15. 前端-CSS,语法、元素、属性、动画、计算方法布局及简单实战项目
  16. Gossip协议笔记--谣言、流行病协议
  17. 常用软件的安装与卸载
  18. 现实迷途 第二十章 峰回路转
  19. 某程序员上线原谅宝:抓取全球不可描述网站和社交平台10万渣女
  20. Linux Ubuntu下载

热门文章

  1. 伦敦玛丽女王大学计算机科学本科,2020年伦敦大学玛丽女王学院开设了哪些计算机专业?入学要求有哪些?...
  2. oracle dg物理和逻辑,物理DG与逻辑DG的区别与逻辑DG同步异常处理方法-Oracle
  3. 物联网如何支持汽车安全驾驶
  4. 计算机应用能力优胜奖,计算机应用技能竞赛结果揭晓
  5. 诺基亚E63内存清理法
  6. 2021,中国计算产业的“攀登者勋章”
  7. 【秋招纪实录】一篇特别正经的【腾讯】求职经验分享
  8. DM数据库——模式、表、索引管理基础(超详细版)
  9. Markdown添加emoji表情
  10. 高中计算机学考什么时候,2017年普通高中信息技术学科学业水平考试时间、考试方式、考试内容...