【联邦学习】IID与非IID数据
文章目录
- 一、引言
- 二、什么是IID、非IID
- 三、联邦学习下的IID与非IID
- 参考链接
一、引言
在联邦学习系统中,来自不同参与方的数据可能会导致出现 非独立同分布 的情况。并且不同的参与方可能有数量不均的训练数据样本,这可能导致联邦模型产生偏差,甚至会使联邦模型训练失败。
在联邦学习系统中,因为数据是由用户自己收集的,可能各自相差很大。但是如果数据非独立同分布就会影响训练。所以联邦学习中存在数据是IID还是非IID的讨论。
二、什么是IID、非IID
数据独立同分布(Independent Identically Distribution,IID):数据与数据之间都是独立的,但满足同一个分布。(独立:一个数据的出现不会影响另一个数据)
当随机变量集合中的每个随机变量都具有相同的概率分布时,则该集合是独立的、同分布的,即IID。
在所有其他情况下,数据都是非独立的、同分布的,即非IID。
三、联邦学习下的IID与非IID
在联合学习的背景下,当 每个样本在每个客户机上出现的可能性相等 时,数据就是IID。
事实上,IID 永远不会发生,因为数据是由客户生成的,因此客户将影响包含特定样本的概率。这在联邦学习中是不可避免的。
由于数据不会被聚合,而且训练只发生在主要由个人创建的本地数据上,因此这些数据不可避免地会包含由他们的行为导致的某些模式。结果是,数据并不是独立且相同地分布的,我们将这种情况称为非IID数据。
传统的机器学习技术假设数据的IID。研究表明,机器学习的范式发生了转变,从假设IID数据转变为假设非IID数据。
参考链接
- 论文:Robustness of FederatedAveraging for Non-IID Data
【联邦学习】IID与非IID数据相关推荐
- 基于联邦学习的多源异构数据融合算法
摘 要 随着科技的迅猛发展,具有计算和存储能力的边缘设备数量不断增加,产生的数据流量更是呈指数式增长,这使得以云计算为核心的集中式处理模式难以高效处理边缘设备产生的数据.另外,由于边缘网络设备的多样性 ...
- 基于联邦学习的多源异构数据融合算法 Multi-Source Heterogeneous Data Fusion Based on Federated Learning
5.基于联邦学习的多源异构数据融合算法 Multi-Source Heterogeneous Data Fusion Based on Federated Learning 摘要:随着科技的迅猛发展, ...
- 联邦学习中常见的Clients数据Non-IID非独立同分布总结
联邦学习 写在前面 联合概率分布 联邦学习中客户端数据Non-IID分布的五种类型: 类型1:Feature distribution skew (convariate shift) 类型2:Labe ...
- 坑挺多 | 联邦学习FATE:上传数据(一)
吐槽一下这个号称"最流行"的联邦学习框架,对新手入门非常不友好,从安装到上传数据,需要多个文档对着看,列举一下笔者在自己测试时候的坑: 代码确实有,但是配套的说明文档不是一气呵成的 ...
- 联邦学习【分布式机器学习技术】【①各客户端从服务器下载全局模型;②各客户端训练本地数据得到本地模型;③各客户端上传本地模型到中心服务器;④中心服务器接收各方数据后进行加权聚合操作,得全局模型】
随着计算机算力的提升,机器学习作为海量数据的分析处理技术,已经广泛服务于人类社会. 然而,机器学习技术的发展过程中面临两大挑战: 一是数据安全难以得到保障,隐私数据泄露问题亟待解决: 二是网络安全隔离 ...
- 虚拟专题:联邦学习 | 面向隐私保护的非聚合式数据共享综述
来源:通信学报 面向隐私保护的非聚合式数据共享综述 李尤慧子1, 殷昱煜1, 高洪皓2,3, 金一4, 王新珩5 1 杭州电子科技大学计算机学院,浙江 杭州 310018 2 上海大学计算机工程与科学 ...
- 如何用最短的时间理解一项数字技术?推荐这7本最新的白皮书(大数据、云原生、区块链、联邦学习等,附下载)...
正文开始 信息技术.数据被国家认定为新的生产要素,对于数据从业者来说是时代赋予的巨大红利,但也要认识到,数据要素要发挥出价值,离不开数据要素市场的培育,更依赖于信息技术(大数据.人工智能.区块链.云计 ...
- 联邦学习最新研究趋势
2020-03-13 09:48:18 在2019年大火的联邦学习,最新的研究进展怎么样了? 文 | 蒋宝尚 编 | 贾 伟 联邦学习无疑是近期 AI 界最火爆的技术范式之一,在过去的2019年,涌现 ...
- 虚拟专题:联邦学习 | 联邦学习算法综述
来源:大数据期刊 联邦学习算法综述 王健宗1 ,孔令炜1 ,黄章成1 ,陈霖捷1 ,刘懿1 ,何安珣1 ,肖京2 1. 平安科技(深圳)有限公司,广东 深圳 518063 2. 中国平安保险(集团)股 ...
最新文章
- R语言构建logistic回归模型并评估模型:模型预测结果抽样、可视化模型分类预测的概率分布情况、使用WVPlots包绘制ROC曲线并计算AUC值
- python基础-资料整理_已迁移
- python入门到实践-看完Python从入门到实践后该看什么书?
- 如何做好Code Review
- 锐捷服务器虚拟化技术_数据中心边缘虚拟交换(IEEE 802.1Qbg)技术白皮书
- STL容器底层数据结构的实现
- 【转】SharePoint 2010 用户自定义编辑Meta标签的OOB方法
- CentOS5.5下SVN部署文档
- 菜鸟裹裹宣布:让数十万快递小哥月入过万成为常态
- GROUPING amp; GROUPING_ID amp; GROUP_ID amp; GROUPING SETS
- 利用通用权限管理系统底层解决数据从不同库的导入导出问题
- BX+CX+loop
- es6 将字符串转换为json_ES6中Json、String、Map、Object之间的转换
- FPGA与数字信号处理
- python numpy.linalg.norm函数的用法
- 密码学三大顶会和信息安全四大顶会网址
- 大学计算机信息技术课程评价,信息技术课程学习心得体会精选范文
- 南大小百合 计算机,是我从南大小百合里搜集的。已经编辑过了
- Mysql创建用户并赋予权限
- 至少12亿元收支差,分析运营商7大数据产品应用
热门文章
- c语言怎么做课程表,怎么用记事本做一个漂亮的网页课程表(1)?
- 梦幻西游维护后的测试服务器,梦幻西游:测试服务器迎来二次维护,伤害衰减BUG被修复但临时符咋办...
- vue element项目中 数组转字符串 字符串转数组
- 帝国CMS简单的列表或公共模板自定义文字导航高亮显示当前栏目名称教程
- python 从文件夹读取图片
- 微博上那些让我们瞬间释然的话
- 手机游戏降低游戏延迟的软件_《和平精英》手游怎么降低网络延迟 降低网络延迟的方法攻略...
- 计算机删除的照片怎么恢复数据,被删除的照片怎么恢复-快速恢复您丢失的照片...
- 国防科技大学计算机学院窦强,国防科技大学
- Python 中 open(),close()组合与 with open()的区别