1.《CHARACTERIZING ADVERSARIAL SUBSPACES USING LOCAL INTRINSIC DIMENSIONALITY》

该方法背后的原理:对于对抗性子空间,出现在x'附近的样本点可以来自于多个流形。x'与流形S接近这一现象意味着x'的邻域很可能包于S中。然而,如果x'的邻域主要由S中的样本组成,那么x'不太可能是一个对抗样本。因此,x'的周围的样本点加在一起很可能形成比单独的任何一个子流形都要高得多的内维子空间,而对x'计算的LID估计可以预期揭示这一点。(简单来说,对抗样本的领域可能由多个流形的样本点组成。因此,对抗样本的LID值,也就是维度,会更高。)

检测过程:以正常样本为例,首先,使用循环将所有的网络层(包括conv2d、max-pooling、dropout、ReLU和softmax)的输出作为输入计算LID值,记为LID_neg。因为我们期望DNN的每一层都存在对抗区域。接下来,对于对抗样本与噪声样本进行一样的操作,分别记为LID_pos与LID_neg。最后将(LID_pos,LID_neg)作为训练数据训练分类器(如逻辑回归)。

2. 《Detecting Adversarial Samples Using Influence Functions and Nearest Neighbors》

该方法背后的原理:对于一个正常样本,它的k-NN训练样本(嵌入空间中最近邻)和most helpful的训练样本(使用影响函数发现)应该是相关的。然而,对抗样本没有这种相关性,这可以作为对抗攻击的迹象。

首先,用影响函数挑选出2*M个most helpful和most harmful的训练样本。接下来,对其中的每一个样本都采用k-NN提取helpful/harmful的特征(ranks and distances),命名为NNIF_neg。对于对抗样本进行童谣的操作,命名为NNIF_pos。最后,以(NNIF_pos,NNIF_neg)为训练数据训练出一个分类器。实验结果显示,该方法优于DkNN、LID以及Mahalanobis。

对抗样本检测adversarial detection techniques相关推荐

  1. LNG:首个基于图的对抗样本检测方法

    关注公众号,发现CV技术之美 Adversarial Example Detection Using Latent Neighborhood Graph 论文链接:  https://openacce ...

  2. 科研篇二:对抗样本(Adversarial Example)综述

    文章目录 一.写作动机与文献来源 二.术语定义 2.1.对抗样本/图片(Adversarial Example/Image) 2.2.对抗干扰(Adversarial perturbation) 2. ...

  3. 对抗样本方向(Adversarial Examples)2018-2020年最新论文调研

    调研范围 2018NIPS.2019NIPS.2018ECCV.2019ICCV.2019CVPR.2020CVPR.2019ICML.2019ICLR.2020ICLR 2018NIPS Conta ...

  4. 论文研读1——对抗样本(Adversarial Example)综述(2018版)

    论文地址:Threat of Adversarial Attacks on Deep Learning in Computer Vision: A Survey 部分内容参考科研篇二:对抗样本(Adv ...

  5. 论文笔记: 对抗样本 CVPR2021 Enhance Transferability of Adversarial Attacks through Variance Tuning

    目录 Abstract 摘要 1. Introduction 引言 1.1 背景 1.2 引入 2. 相关工作 Related Work 2.1 对抗样本攻击 2.2 对抗样本防御 Adversari ...

  6. 对抗样本攻防战,清华大学TSAIL团队再获CAAD攻防赛第一

    最近,在全球安全领域的殿堂级盛会 DEF CON 2018 上,GeekPwn 拉斯维加斯站举行了 CAAD CTF 邀请赛,六支由国内外顶级 AI 学者与研究院组成的队伍共同探讨以对抗训练为攻防手段 ...

  7. 对抗机器学习(Adversarial Machine Learning)发展现状

    目录 1. 了解对手 1. 1 攻击目标(Goal) 1. 2 知识储备(Knowledge) 1.3 能力限制(Capability) 1.4 攻击策略(Strategy) 2. 学会主动 2.1 ...

  8. 【AI安全之对抗样本】入门知识

    文章目录 00 前言 01 深度学习脆弱性 1.1 偷取模型 1.2 数据投毒 02 对抗样本(adversarial examples) 2.1 对抗样本定义 2.2 对抗样本原理 2.3 针对图像 ...

  9. ACL2020 | 使用强化学习为机器翻译生成对抗样本

    2020-07-12 03:08:49 本文介绍的是 ACL 2020 论文<A Reinforced Generation of Adversarial Examples for Neural ...

最新文章

  1. java 注解scheduler_使用Scheduler
  2. ORA-01078与LRM-00109报错解决
  3. HTML5新特性介绍
  4. stm32官方例程在哪找_正点原子Linux第十一章模仿STM32驱动开发格式实验
  5. Java面试总结系列之Collections.sort()
  6. 如何删除一个VDP服务器
  7. c#和c++的opencv位图数据参数互换问题解决方法
  8. python的计算_python 计算方位角实例(根据两点的坐标计算)
  9. php内核一 一次请求与结束
  10. C/C++面试题总结
  11. 【BZOJ-1502】月下柠檬树 计算几何 + 自适应Simpson积分
  12. linux screen会话命令
  13. 2021最新SSM博客,功能完善,初云博客增强版
  14. chinapub读书会第10期:机器学习与人工智能 6月25日相约阿里云+优客工场
  15. 操作系统课程设计-模拟操作系统
  16. 怎样在线分解gif图片?如何将gif拆分为静态图片?
  17. 文件被别的程序打开无法删除怎么办?
  18. 【刷题】【2.两数之和绝对值最小】
  19. html5 生日贺卡在线制作软件,可在线制作或打印的个性化照片贺卡
  20. 2021-09-30 cannot locate default realm

热门文章

  1. NAACL 2022 | DiffCSE:基于差异的句向量对比学习方法
  2. 普元eos使用svn_进行中
  3. 【计算机基础】02Windows7操作系统
  4. 平安智慧企业_赋能业务 快乐平安APP荣获“2019中国智能办公年度优秀产品奖”...
  5. python下载网页文件数字递进_关于Python 生成一个递进结果的代码
  6. android 美图 app下载,美图手机相机app下载-美图手机相机 安卓版v1.5.0-PC6安卓网
  7. 中山大学和北邮计算机,中山大学和北京邮电大学之间怎么选择?两所学校的特色有什么不同?...
  8. 第二届中国数据安全治理高峰论坛在京召开
  9. 如何快速找到适合发表的期刊
  10. 大小写字母转换(word)