对抗样本检测adversarial detection techniques

1.《CHARACTERIZING ADVERSARIAL SUBSPACES USING LOCAL INTRINSIC DIMENSIONALITY》

该方法背后的原理：对于对抗性子空间，出现在x'附近的样本点可以来自于多个流形。x'与流形S接近这一现象意味着x'的邻域很可能包于S中。然而，如果x'的邻域主要由S中的样本组成，那么x'不太可能是一个对抗样本。因此，x'的周围的样本点加在一起很可能形成比单独的任何一个子流形都要高得多的内维子空间，而对x'计算的LID估计可以预期揭示这一点。(简单来说，对抗样本的领域可能由多个流形的样本点组成。因此，对抗样本的LID值，也就是维度，会更高。)

检测过程：以正常样本为例，首先，使用循环将所有的网络层（包括conv2d、max-pooling、dropout、ReLU和softmax）的输出作为输入计算LID值，记为LID_neg。因为我们期望DNN的每一层都存在对抗区域。接下来，对于对抗样本与噪声样本进行一样的操作，分别记为LID_pos与LID_neg。最后将（LID_pos,LID_neg）作为训练数据训练分类器（如逻辑回归）。

2. 《Detecting Adversarial Samples Using Influence Functions and Nearest Neighbors》

该方法背后的原理：对于一个正常样本，它的k-NN训练样本(嵌入空间中最近邻)和most helpful的训练样本(使用影响函数发现)应该是相关的。然而，对抗样本没有这种相关性，这可以作为对抗攻击的迹象。

首先，用影响函数挑选出2*M个most helpful和most harmful的训练样本。接下来，对其中的每一个样本都采用k-NN提取helpful/harmful的特征(ranks and distances)，命名为NNIF_neg。对于对抗样本进行童谣的操作，命名为NNIF_pos。最后，以（NNIF_pos，NNIF_neg）为训练数据训练出一个分类器。实验结果显示，该方法优于DkNN、LID以及Mahalanobis。

对抗样本检测adversarial detection techniques相关推荐

LNG：首个基于图的对抗样本检测方法
关注公众号,发现CV技术之美 Adversarial Example Detection Using Latent Neighborhood Graph 论文链接: https://openacce ...
科研篇二：对抗样本（Adversarial Example）综述
文章目录一.写作动机与文献来源二.术语定义 2.1.对抗样本/图片(Adversarial Example/Image) 2.2.对抗干扰(Adversarial perturbation) 2. ...
对抗样本方向（Adversarial Examples）2018-2020年最新论文调研
调研范围 2018NIPS.2019NIPS.2018ECCV.2019ICCV.2019CVPR.2020CVPR.2019ICML.2019ICLR.2020ICLR 2018NIPS Conta ...
论文研读1——对抗样本(Adversarial Example)综述（2018版）
论文地址:Threat of Adversarial Attacks on Deep Learning in Computer Vision: A Survey 部分内容参考科研篇二:对抗样本(Adv ...
论文笔记：对抗样本 CVPR2021 Enhance Transferability of Adversarial Attacks through Variance Tuning
目录 Abstract 摘要 1. Introduction 引言 1.1 背景 1.2 引入 2. 相关工作 Related Work 2.1 对抗样本攻击 2.2 对抗样本防御 Adversari ...
对抗样本攻防战，清华大学TSAIL团队再获CAAD攻防赛第一
最近,在全球安全领域的殿堂级盛会 DEF CON 2018 上,GeekPwn 拉斯维加斯站举行了 CAAD CTF 邀请赛,六支由国内外顶级 AI 学者与研究院组成的队伍共同探讨以对抗训练为攻防手段 ...
对抗机器学习（Adversarial Machine Learning）发展现状
目录 1. 了解对手 1. 1 攻击目标(Goal) 1. 2 知识储备(Knowledge) 1.3 能力限制(Capability) 1.4 攻击策略(Strategy) 2. 学会主动 2.1 ...
【AI安全之对抗样本】入门知识
文章目录 00 前言 01 深度学习脆弱性 1.1 偷取模型 1.2 数据投毒 02 对抗样本(adversarial examples) 2.1 对抗样本定义 2.2 对抗样本原理 2.3 针对图像 ...
ACL2020 | 使用强化学习为机器翻译生成对抗样本
2020-07-12 03:08:49 本文介绍的是 ACL 2020 论文<A Reinforced Generation of Adversarial Examples for Neural ...

对抗样本检测adversarial detection techniques

对抗样本检测adversarial detection techniques相关推荐

最新文章

热门文章