对抗性训练最大最小化公式:
min ⁡ θ E ( x , y ) ∼ D [ max ⁡ Δ x ∈ Ω L ( x + Δ x , y ; θ ) ] \min_{\theta}\mathbb{E}_{(x,y)\sim\mathcal{D}}\left[\max_{\Delta x\in\Omega}L(x+\Delta x, y;\theta)\right] θmin​E(x,y)∼D​[Δx∈Ωmax​L(x+Δx,y;θ)]

D \mathcal{D} D表示训练数据, x x x表示输入, y y y表示标签, θ \theta θ表示模型参数, L ( ⋅ ) L(·) L(⋅)表示损失函数, Δ x \Delta x Δx表示对抗扰动, Ω \Omega Ω表示扰动空间。

最大化和最小化的对象不同:

  • 最大化扰动量 max ⁡ Δ x \max{\Delta x} maxΔx
  • 最小化平均损失 min ⁡ E ( x , y ) L ( ⋅ ) \min{\mathbb{E}_{(x,y)}L(·)} minE(x,y)​L(⋅)

最终目的:优化模型参数 θ \theta θ,提高DL模型的泛化性能。

对抗性训练过程如下:

  1. 向输入 x x x里中添加扰动 Δ x \Delta x Δx, Δ x \Delta x Δx会使得模型无法得到正确的预测结果 y y y,即 f ( x + Δ x ) ≠ y f(x+\Delta x)≠y f(x+Δx)​=y,从而依据损失函数产生相应损失值。其中 Δ x \Delta x Δx的值会被限制在扰动空间 Ω \Omega Ω内,如 ∥ Δ x ∥ ≤ ϵ \|\Delta x\| \leq \epsilon ∥Δx∥≤ϵ,确保输入样本对人来说无差别。
  2. 模型添加扰动后的输入为 x + Δ x x+\Delta x x+Δx,利用 ( x + Δ x , y ) (x+\Delta x,y) (x+Δx,y)来训练模型,更新模型参数 θ \theta θ来最小化训练数据的平均损失。

对抗性训练(Adversarial training)相关推荐

  1. [半监督学习] Virtual Adversarial Training: A Regularization Method for Supervised and SSL

    提出一种基于虚拟对抗损失的新正则化方法, 虚拟对抗性损失被定义为每个输入数据点周围的条件标签分布对局部扰动的鲁棒性. 与对抗训练不同, VAT 方法在没有标签信息的情况下定义了对抗方向, 因此适用于半 ...

  2. 报名 | “阳奉阴违”的半监督学习算法 - Virtual Adversarial Training

    「论文共读」是由 PaperWeekly 发起的协同阅读小组.我们每周精选一篇优质好文,由学术大咖带大家解读论文并展开讨论,在碎片化时代坚持深度阅读. 本期论文共读由 PaperWeekly 社区用户 ...

  3. 论文共读 | “阳奉阴违”的半监督学习算法 - Virtual Adversarial Training

    「论文共读」是由 PaperWeekly 发起的协同阅读小组.我们每周精选一篇优质好文,由学术大咖带大家解读论文并展开讨论,在碎片化时代坚持深度阅读. 本期论文共读由 PaperWeekly 社区用户 ...

  4. 文献阅读课13-DSGAN: Generative Adversarial Training for (远程监督关系抽取,句子级去噪)

    文章目录 Abstract 1.Introduction 2.相关工作 3 Adversarial Learning for Distant Supervision 3.1 Pre-Training ...

  5. AAAI2018-Long Text Generation via Adversarial Training with Leaked Information论文笔记

    这篇文章主要是名为 LeakGAN 的模型结构,同时处理 D 反馈信息量不足和反馈稀疏的两个问题.LeakGAN 就是一种让鉴别器 D 提供更多信息给生成器 G 的新方式,我自己的笔记: 转自:htt ...

  6. [论文翻译]数据集的domian问题:Intramodality Domain Adaptation Using Self Ensembling and Adversarial Training

    论文pdf下载: 链接 Intramodality Domain Adaptation Using Self Ensembling and Adversarial Training 使用自集成和对抗性 ...

  7. GAN异常检测论文笔记(一)《GANomaly: Semi-Supervised Anomaly Detection via Adversarial Training》

    0 Abstract: 通过使用一个联合学习高维图像空间的生成和潜伏空间的推理的生成对抗性网络,引入了这种新型的异常检测模型.在生成器网络中采用编码器-解码器-编码器子网络,使模型能够将输入图像映射为 ...

  8. Directional Adversarial Training for Recommender Systems

    Directional Adversarial Training for Recommender Systems 论文理解与翻译: 1.摘要: (话题方向切人,他人最近的有关成果,再次基础上他人成果的 ...

  9. Smooth Adversarial Training

    Smooth Adversarial Training 写了AdvProp的这些人又提了一个SAT 写AdvProp主要是朝着提升accuracy的目标去的,说是比AT更好 写SAT则以提升robus ...

最新文章

  1. 微服务的基石--持续集成
  2. 查理和政策配对工厂——设计一个问卷运算系统的B端到C端
  3. 一个12年ABAP开发专家和ABAP那些事儿
  4. No Identifier specified for entity的解决办法
  5. 组织c语言程序的是什么,C程序在内存中的组织方式
  6. 如果conda找不到想要安装的库怎么办PackagesNotFoundError: The following packages are not available from current
  7. 大数据分析有哪些特征
  8. <matplotlib.lines.Line2D object at 0x7f68cfd5a2e8>终极解决办法
  9. javascript ajax调用asp.net后台方法
  10. H3C DHCP实验
  11. python async_python async
  12. [USACO DEC13] 牛棒球
  13. python语言基础与应用 mooc答案_Python语言基础与应用_中国大学 MOOC_章节考试选修课答案...
  14. 移动边缘计算与计算卸载概述
  15. Acer EC-471G BIOS升级注意事项
  16. java jxls_java使用jxls导出Excel
  17. 鸿蒙系统视频美颜,BeautyCam美颜相机
  18. 应聘高校教师的试讲技巧
  19. python3 Json转xmind代码与打开
  20. 如何安装虚拟机———一台电脑,多个系统体验

热门文章

  1. html中加号用什么表示,HTML基础-常用标签及属性
  2. 简读《隐私科技白皮书》| 一文了解隐私科技
  3. 直播系统实现: nginx + OBS + H5
  4. 整数划分(计数类DP)
  5. CPA2021_会计_东奥张志凤_02_会计概述、财务报告目标、会计基本假设和会计基础
  6. overpic宏包插入文字(latex)
  7. 【模电】0005 光耦的使用
  8. 株洲市八中2021高考成绩查询,2020株洲市地区高考成绩排名查询,株洲市高考各高中成绩喜报榜单...
  9. nunjucks简单上手
  10. 小米手环4 你值得拥有(彩屏,支付宝,AI,公交门禁,音乐控制该有的都有了)