前言：

阅读本文前，默认对2017ICLR的PATE方法有所了解，若有不了解PATE的读者，建议去翻阅上一篇博客。

方法：

该论文发表于2018的ICLR，是原作者对2017ICLR的PATE方法的改进。

简单的回顾一下PATE的工作。

在机器学习领域中，模型的训练需要大量的数据。在一些医疗，金融等领域，这些数据通常有着高隐私的特点。比如一项疾病的预测，这类数据和病人的隐私息息相关。当前的一些攻击手段例如模型反演，成员推理攻击等可以从模型中反推出训练数据（一个样本在或者不在训练数据中，如一个人在一个患病数据集中，那么该患者患病的事实被泄露）。

PATE方法将私有数据集划分为N个不相交的数据集，然后独立于这些数据集训练不同的模型，得到N个教师模型。在部署经过训练的教师模型时，我们记录每个教师模型的预测结果，对预测结果进行聚合，并在聚合结果中加入符合差异隐私的拉普拉斯噪声，以保护隐私信息。然后，使用聚合教师模型对公共数据进行注释，将加入噪声后投票数量最高的一类作为公共数据的伪标签，并传递知识来训练学生模型。

然而，迄今为止，PATE仅在简单的分类任务（如MNIST）上进行评估，在应用于更大规模的学习任务和真实数据集时，其效用尚不清楚。

最初的PATE(以下简称LNMAX)方法存在着几个问题。SCALABLE PRIVATE LEARNING WITH PATE（以下简称GNMANX）改进如下：

当我们聚合教师模型之后，向聚合教师模型中输入一个公共数据的查询f(x),每个教师模型都会给出自己的一个预测结果，将这些预测结果聚合起来并根据类别进行投票，PATE方法向聚合的投票结果中加入拉普拉斯噪声。

为了增加更少的噪声，新的PATE聚集机制（GNMAX）对高斯噪声进行采样，因为该分布的尾部衰减速度远远快于原始PATE（LNMAX）工作中使用的拉普拉斯噪声。这种减少极大地增加了教师投票的嘈杂聚集产生正确共识答案的机会，这在将PATE扩展到包含大量输出类的学习任务时尤为重要。

然后利用RDP（2017 renyi differential privacy）方式对这种GNMAX进行了隐私分析。这种修改有效地减少了噪音，以实现每个学生查询相同的隐私成本。

其次，在聚合的加噪之后的投票结果加入了可选择性。LNMAX直接返回加入拉普拉斯噪声之后投票数最高的一类作为公共数据的伪标签。这种方式会带来更大的隐私损失也会造成精度损失。

当某一个查询输入到聚合教师模型之后，聚合模型会给出预测值。当预测的结果存在混淆时，很有可能最终答案决定于某一个教师模型，从而导致隐私泄露。同时存在混淆结果时，模型的精度也会随之下降。对此GNMAX提出了一种自信聚合器的方式。

首先将聚合的投票结果进行检查。将投票结果加入一定尺度σ1的高斯噪声后，检查投票的最大值是否超过设定的阈值T。

当小于设定的阈值T时，我们认为该查询的教师一致性低，如果对该查询进行回答则会增加隐私成本同时造成精度损失。所以我们不回答该查询。

当加入一定尺度σ1的高斯噪声后，投票的最大值大于设定的阈值T，我们认为该查询的教师一致性足够高，教师模型之间存在足够强的共识，回答该查询添加一定尺度的噪声也不会造成太大的精度损失。

我们对该查询对应的聚合投票中添加尺度为σ2的高斯噪声，同时返回添加噪声后投票数量最大的一类作为该查询的伪标签。

在GNMAX的设置中，σ1的值远大于σ2（在GNMAX的实验中σ1=2000，σ2=2000或者σ1=1500，σ2=100）。即当添加大尺度的噪声后某一投票值会大于设定的阈值，那么我们添加小尺度的高斯噪声在该投票结果中大概率argmaxN(x)还是会大于设定的阈值T，此时教师模型的一致性足够强。

论文原话：在实践中，我们经常为σ 1选择比σ 2高得多的值。这是因为我们总是要为嘈杂的阈值检查付出代价，而不知道共识是强大的。我们选择T，以便在添加噪声后，多数人获得的票数不到一半（通常非常昂贵）的查询不太可能通过阈值，但在具有强烈共识的查询中，我们仍然有足够高的收益率。这种权衡让我们寻找0.6*n到0.8*n之间的教师人数。

GNMAX还提出了一种回答策略：一种交互式聚合器。该算法的主要思想是不仅考虑了教师对被查询示例的投票，还考虑了学生对该查询的可能预测。现在，值得回答的问题是，老师们对一门课的看法一致，但学生们对该课的预测没有信心。学生已经同意老师的共识的问题不值得我们花费隐私预算，但学生信心不足的问题是有用的，并且回答的隐私成本很低。不再赘述。

总结：

GNMAX是LNMAX的一种改进版，从理论和实验都证明了该方法由于LNMAX。

GNMAX在epsilon低于LNMAX的情况下，精度也优于LNMAX。

SCALABLE PRIVATE LEARNING WITH PATE论文笔记相关推荐

3D Bounding Box Estimation Using Deep Learning and Geometry 论文笔记
3D Bounding Box Estimation Using Deep Learning and Geometry 论文链接: https://arxiv.org/abs/1612.00496 一 ...
《word2vec Parameter Learning Explained》论文笔记
word2vec Parameter Learning Explained Xin Rong(ronxin@umich.edu)[致敬] arXiv:1411.2738v4 [cs.CL] 5 Jun ...
Optimus: An Efficient Dynamic Resource Scheduler for Deep Learning Clusters（论文笔记）
文章目录问题设计深度学习任务的性能建模学习收敛曲线资源-速度建模动态调度资源分配任务放置问题在一个共享的深度学习集群中,同一时期会提交各种各样的训练任务,高效的资源调度能够最大化利 ...
SEMI-SUPERVISED KNOWLEDGE TRANSFERFOR DEEP LEARNING FROM PRIVATE TRAINING DATA（PATE）论文笔记
PATE是ICLR2017的best paper,可以在YouTube上观看作者的演讲视频 https://www.youtube.com/watch?v=bDayquwDgjU PATE论文的源代码 ...
【论文笔记09】Differentially Private Hypothesis Transfer Learning 差分隐私迁移学习模型, ECMLPKDD 2018
目录导引系列传送 Differentially Private Hypothesis Transfer Learning 1 Abstract 2 Bg & Rw 3 Setting &am ...
论文笔记（十一）：Learning to Track with Object Permanence
Learning to Track with Object Permanence 文章概括摘要 1. 介绍 2. 相关工作 3. 研究方法 3.1 背景 3.2 用于跟踪的视频级模型 3.3. 学会 ...
【论文笔记】 LSTM-BASED DEEP LEARNING MODELS FOR NONFACTOID ANSWER SELECTION
一.简介这篇论文由IBM Watson发表在2016 ICLR,目前引用量92.这篇论文的研究主题是answer selection,作者在这篇论文基础上[Applying Deep Learnin ...
论文笔记之：Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning
论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning 2017-06-06 21: ...
Deep Learning论文笔记之（八）Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...

SCALABLE PRIVATE LEARNING WITH PATE论文笔记

前言：

方法：

总结：

SCALABLE PRIVATE LEARNING WITH PATE论文笔记相关推荐

最新文章

热门文章