3. Our NICE-GAN

3.1. General Formulation

No Independent Component for Encoding (NICE).

以domain yyy上的判别器DyD_yDy​为例,DyD_yDy​的结构包括encoder EyDE_y^DEyD​,以及classifier CyC_yCy​

DyD_yDy​不断学习到判别图像是否属于domain yyy的能力,因此encoder EyDE_y^DEyD​提取的特征是非常有用的,于是y→xy\rightarrow xy→x的生成器可以复用EyDE_y^DEyD​

3.2. Architecture

Multi-Scale Discriminators DxD_xDx​ and DyD_yDy​.

第1处结构上的改进,判别器的结构使用multi-scale structure

之前的文章中也使用了Multi-Scale Discriminators,具体来说,将图像down-sampling为一系列尺寸,然后将这一系列图像送入一系列判别器中

本文采用的做法更加efficient,具体Multi-Scale Discriminators的结构如Figure 2所示,总共设置了3级{Cx0,Cx1,Cx2}\left \{ C_x^0, C_x^1, C_x^2 \right \}{Cx0​,Cx1​,Cx2​}

简单来说就是图像经过encoder之后的feature map送入Cx0C_x^0Cx0​,然后经过卷积得到feature map送入Cx1C_x^1Cx1​,最后再经过卷积得到feature map送入Cx2C_x^2Cx2​

第2处结构上的改进,对于U-GAT-IT中的CAM attention,本文将它升级为残差的版本

Ex(x)E_x(x)Ex​(x)是encoder得到的feature map,利用CAM学习到一个weight www,U-GAT-IT的做法是使用www对Ex(x)E_x(x)Ex​(x)进行加权,得到reweighted feature map(又称attention map)

本文的做法是引入一个trainable parameter γ\gammaγ,来线性组合原始Ex(x)E_x(x)Ex​(x)与加权的Ex(x)E_x(x)Ex​(x),即γ×w×Ex(x)+Ex(x)\gamma\times w\times E_x(x) + E_x(x)γ×w×Ex​(x)+Ex​(x)

第3处结构上的改进,对判别器使用spectral normalization

3.3. Decoupled Training

因为Encoder是复用的,所以 it will incur inconsistency if we apply conventional adversarial training.(缺乏一个理论上的解释)

To overcome this defect, we decouple the training of ExE_xEx​ from that of the generator Gx→yG_{x\rightarrow y}Gx→y​.

Reusing Discriminators for Encoding: Towards Unsupervised Image-to-Image Translation(CVPR20)相关推荐

  1. 【论文译文】Few-Shot Unsupervised Image-to-Image Translation(FUNIT)

    译文仅供参考! 原文是pdf,想下载的话可以戳:http://www.gwylab.com/pdf/FUNIT_chs.pdf

  2. [论文阅读]ICE: Inter-instance Contrastive Encoding for Unsupervised Person Re-identification(ICCV2021)

    ICE: Inter-instance Contrastive Encoding for Unsupervised Person Re-identification(ICCV2021) 实例间对比学习 ...

  3. 对比学习系列论文MoCo v1(二):Momentum Contrast for Unsupervised Visual Representation Learning

    0.Abstract 0.1逐句翻译 We present Momentum Contrast (MoCo) for unsupervised visual representation learni ...

  4. 阅读文献“Language Models are Unsupervised Multitask Learner”(GPT-2)

    阅读文献"Language Models are Unsupervised Multitask Learner"(GPT-2) Abstract zero-shot:指在分类任务中 ...

  5. Unsupervised Deep Image Stitching:首个无监督图像拼接框架(TIP2021)

    作者丨廖康@知乎 来源丨https://zhuanlan.zhihu.com/p/386863945 编辑丨3D视觉工坊 一.写在前面 图像拼接(Image Stitching)可以说是计算机视觉领域 ...

  6. 机器学习类别/标称(categorical)数据处理:目标编码(target encoding)

    机器学习类别/标称(categorical)数据处理:目标编码(target encoding) 序号编码:序号编码通常用于处理类别间具有大小关系的数据 可以通过导入sklearn.preproces ...

  7. 机器学习类别/标称(categorical)数据处理:序号编码(Ordinal Encoding)

    机器学习类别/标称(categorical)数据处理:序号编码(Ordinal Encoding) 序号编码:序号编码通常用于处理类别间具有大小关系的数据 可以通过导入sklearn.preproce ...

  8. 机器学习类别/标称(categorical)数据处理:独热编码(One Hot Encoding)

    机器学习类别/标称(categorical)数据处理:独热编码(One Hot Encoding) 序号编码:序号编码通常用于处理类别间具有大小关系的数据 可以通过导入sklearn.preproce ...

  9. 安装sklearn-poter遇到报错(TypeError:‘encoding‘ is an invalid keyword argument for this function)

    问题: 在python2.7环境下进行sklearn-poter模块的安装的时候报错如下: 解决方法1:(未尝试) 遇到错查度娘,建议升级: 升级pip:python -m pip install - ...

最新文章

  1. 微生物所高程-郭良栋组(内附招聘)在菌根适应策略研究中取得进展
  2. 计算机网络教学重点突破,武汉理工大学计算机网络复习重点教学内容(34页)-原创力文档...
  3. pil拷贝,剪切,缩放
  4. C/C++浮点数在内存中的存储方式
  5. es最新的集群选举策略
  6. openid saml2_单一登录云:SAML和OpenId
  7. LeetCode 609. 在系统中查找重复文件(哈希)
  8. 作者:司光亚(1967-),男,国防大学信息作战与指挥训练教研部教授,主要研究方向为战争复杂系统建模仿真。...
  9. JQuery DataTables 列自己定义数据类型排序
  10. 解决滑动UITableView自动显示delete按钮
  11. 【leetcode 简单】第五题 最长公共前缀
  12. 给自己一个没有退路的悬崖
  13. 双向链表与LinkedHashMap
  14. 西门子 Process Simulate学习笔记(一)
  15. 实验五 集线器和交换机的区别
  16. 计算机通信过程详解 与 arp欺骗
  17. 推荐10个免费在线测试网页性能工具
  18. ChromeOptions--禁止加载图片
  19. 正交试验设计的基本步骤
  20. 什么是 RESTful ?

热门文章

  1. 计算广告笔记-计算广告技术概览
  2. 长江后浪推前浪,不学SpringBoot就会被拍到沙滩上
  3. 【c++】龟兔赛跑问题
  4. 知乎高赞:程序员需要达到什么水平才能顺利拿到20k?
  5. 在复杂世界,寻找简单而普遍的规律!世界区块链大会新添10位重磅嘉宾
  6. 央视315曝光软件捆绑问题:必须打击违规软件下载网站
  7. 新手必看!超有用的Apple Watch设置技巧分享
  8. cr2 android,Canon Camera Connect
  9. 网络五大层介绍,看完你就懂
  10. matlab正交gold码的相关性,基于Matlab的CDMA通信系统仿真