GAN的局限性
即便如此,传统的GAN也不是万能的,它有下面两个不足:

1. 没有**用户控制(user control)**能力
在传统的GAN里,输入一个随机噪声,就会输出一幅随机图像。

但用户是有想法滴,我们想输出的图像是我们想要的那种图像,和我们的输入是对应的、有关联的。比如输入一只喵的草图,输出同一形态的喵的真实图片(这里对形态的要求就是一种用户控制)。

2. 低分辨率(Low resolution)和低质量(Low quality)问题

尽管生成的图片看起来很不错,但如果你放大看,就会发现细节相当模糊

传统的GAN的种种局限,那么现在,我们相应的目标就是:

  • 提高GAN的用户控制能力
  • 提高GAN生成图片的分辨率和质量
  • 为了达到这样的目标,和把大象装到冰箱里一样,总共分三步:

  • pix2pix:有条件地使用用户输入,它使用成对的数据(paired data)进行训练。
    CycleGAN:使用**不成对的数据(unpaired data)**的就能训练。
    pix2pixHD:生成高分辨率、高质量的图像。

  • pix2pix

    pix2pix对传统的GAN做了个小改动,它不再输入随机噪声,而是输入用户给的图片:

  • CycleGAN

    pix2pix必须使用成对的数据进行训练。


  • 但很多情况下成对数据是很难获取到的,比如说,我们想把马变成斑马,现实生活中是不存在对应的真实照片的:

Pix2Pix和CycleGAN相关推荐

  1. 深入理解生成对抗网络(GAN 基本原理,训练崩溃,训练技巧,DCGAN,CGAN,pix2pix,CycleGAN)

    文章目录 GAN 基本模型 模型 GAN 的训练 模式崩溃 训练崩溃 图像生成中的应用 DCGAN:CNN 与 GAN 的结合 转置卷积 DCGAN CGAN:生成指定类型的图像 图像翻译中的应用 p ...

  2. Pix2Pix(2017)+CycleGAN+Pix2PixHD

    GAN 常规的深度学习任务如图像分类.目标检测以及语义分割或者实例分割,这些任务的结果都可以归结为预测.图像分类是预测单一的类别,目标检测是预测Bbox和类别,语义分割或者实例分割是预测每个像素的类别 ...

  3. 深度学习(四十五)——Stack GAN, GAN Ensemble, Pix2Pix, CycleGAN

    Stack GAN 论文: <StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversar ...

  4. #萌新日志#3.使用pix2pix CycleGAN和3d CycleGAN实现T1和T2加权模态的互转

    #萌新记录某些日子的学习经历.# 前言 以GAN为基础的生成式对抗网络从抽象的角度来说是结合一组图像的风格和另一组图像的内容,或者说实现将初始图像从一个域迁移到目标图像的域. 前段时间我尝试了包括pi ...

  5. pix2pix/CycleGAN生成图片上有像破洞的伪影 参考解决方法

    之前训练pix2pix和CycleGAN就经常遇到这个问题,不知道怎么回事.最近又在用pix2pix又发现这个问题,看百度上没有网友有相关解答,就去github的pix2pix官方库搜了一下issue ...

  6. pix2pix测试报错

    错误信息如下: Traceback (most recent call last):   File "/workspace/imageregistration/test.py", ...

  7. GAN在产业和学术届的价值!

    Datawhale学习 方向:GAN,组织:百度技术团队 GAN开始走向主流 随着"蚂蚁牙黑"一夜爆火,以及电影<你好,李焕英>中GAN技术的应用,生成对抗网络( Ge ...

  8. 吴恩达Deeplearning.ai国庆节上新:生成对抗网络(GAN)专项课程

    机器之心报道 作者:蛋酱 Coursera 刚刚上新了 GAN 的专项课程,或许在这个国庆假期,你应该学习一波了. 生成对抗网络(Generative Adversarial Network,GAN) ...

  9. 干货 | 抖音漫画效果解密

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自:AI算法与图像处理 抖音漫画效果 要说最近抖音最火的效果 ...

最新文章

  1. win2008怎么配置php,Win2008 PHP 配置环境搭建 教程
  2. c语言判断数组里的数据先递增后递减,查找两个有序序数组(一个递增、一个递减)中第K大的数...
  3. java中scanner if用法_Java通过Scanner了解if...else if语句
  4. 51CTO -- 网络自学的瓶颈期
  5. mysql 事务权限_0428-mysql(事务、权限)
  6. 在 Gitee 上使用 GPG公钥(Beta版)
  7. python字典更改元素_python – 返回带有一个已更改元素的字典
  8. Pulseaudio调用alsalib write()流程(十六)
  9. 黑苹果 惠普笔记本电池补丁_黑苹果笔记本:关于DSDT亮度表的分析与修改
  10. h264文件视频存储格式和音频存储格式
  11. 计算机网络知识点全面总结(有这一篇就够了!!!)
  12. 富士施乐Fuji Xerox ApeosPort-IV 2060 驱动
  13. matlab shift 详解,MeanShift算法详解以及matlab源码
  14. Js 中null 和underfined的区别
  15. photoshop 重复上一次变换操作 ctrl+shift+alt+t
  16. Web服务器群集——编译安装Nginx-1.16及虚拟主机配置
  17. MFC CPropertySheet控件
  18. 基于GUI的简易图像处理系统设计与实现
  19. iOS 中横竖屏切换
  20. gvim支持python3编译,解决omnicppcomplete中python3complete报错:requried vim complied with +python3

热门文章

  1. SpringSecurity+SpringSocial 实现QQ登入(二)
  2. 用Java计算三角形的面积
  3. 装系统提示缺少计算机所需的介质驱动程序,安装Win10系统提示“缺少计算机所需的介质驱动程序”(图文)...
  4. Linux 学习笔记(自己整理仅供自己复习)
  5. Vmware Centos7 配置静态 ip 和 使宿主机和虚拟机互相 ping 通
  6. 模拟器技术在环保领域的应用
  7. swig java_2019-02-01 使用swig转化C++到Java
  8. 最新web前端面试题大全
  9. 解决 ‘无法启动承载网络 组或资源的状态不是执行请求操作的正确状态’
  10. 【Lovea Chino】Node.js 仙侠传(第一部)