参考:Pix2Pix视频解读

一、Pix2Pix是输入图片矩阵而不是标签向量

1、生成器方面

Pix2Pix与CGAN之间的联系:CGAN生成器输入的是一个label,而我们现在要做的是把这个lable换成一个图片,如下所示。这个图片是一个建筑物的模式图,但是没有刻画建筑物的细节。

生成器通过噪声noise和模式图两个输入,最后生成一个建筑物的图:

2、判别器方面

判别器要做两个方面的事情,一个是判断这个图片是否是真实的建筑物图片,另一个是判断这个建筑物图片是否和模式图相匹配。

3、总体过程

生成器吃进去一个噪声和一个模式图,生成一张建筑物图片,判别器对建筑物图片进行判别:一个是判断这个图片是否是真实的建筑物图片,另一个是判断这个建筑物图片是否和模式图相匹配。

二、Auto-encoder(自动编码器)

         生成器使用了“U-Net”结构,也就是用到了编码器。

深度encoder就是把层数加深,这样的话编码器就有很强的建模能力,能更好地去提取编码。其中Variational Auto Encoder就是给编码上加一些随机噪声,让编码器更加稳定。

U-net把encoder接到了decoder上面,方便训练。

三、PatchGan

        判别器使用了卷积“PatchGAN”分类器(只在patch的规模下惩罚结构)。

pix2pix就是一种更强的CGAN,PatchGAN输出的是一个矩阵,采用L1_loss(两张图片相减取绝对值)判别图片真实性。

Pix2Pix进一步了解相关推荐

  1. 如何判断模糊图像_图像翻译三部曲:pix2pix, pix2pixHD, vid2vid

    所谓图像翻译,指从一副图像到另一副图像的转换.可以类比机器翻译,一种语言转换为另一种语言.下图就是一些典型的图像翻译任务:比如语义分割图转换为真实街景图,灰色图转换为彩色图,白天转换为黑夜...... ...

  2. pix2pix, pix2pixHD, vid2vid

    512*512 https://gitee.com/jacke121/pix2pixHD_ACM 1060 batch-size 1也训练不起来. https://github.com/deepglu ...

  3. 【项目实战课】基于Pytorch的Pix2Pix黑白图片上色实战

    欢迎大家来到我们的项目实战课,本期内容是<基于Pytorch的黑白图像上色实战>.所谓项目实战课,就是以简单的原理回顾+详细的项目实战的模式,针对具体的某一个主题,进行代码级的实战讲解. ...

  4. AI修图!pix2pix网络介绍与tensorflow实现

    1.引言 在现实生活当中,除了语言之间的翻译之外,我们也经常会遇到各种图像的"翻译"任务,即给定一张图像,生成目标图像,常见的场景有:图像风格迁移.图像超级分辨率.图像上色.图像去 ...

  5. [人工智能-深度学习-63]:生成对抗网络GAN - 图片创作:普通GAN, pix2pix, CycleGAN和pix2pixHD的演变过程

    作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客 本文网址:https://blog.csdn.net/HiWangWenBing/article/detai ...

  6. pix2pix 与 pix2pixHD的大致分析

    目录 pix2pix与pix2pixHD的生成器 判别器 PatchGAN(马尔科夫判别器) 1.pix2pix 简单粗暴的办法 如何解决模糊呢? 其他tricks 2.pix2pixHD 高分辨率图 ...

  7. Pix2Pix(2017)+CycleGAN+Pix2PixHD

    GAN 常规的深度学习任务如图像分类.目标检测以及语义分割或者实例分割,这些任务的结果都可以归结为预测.图像分类是预测单一的类别,目标检测是预测Bbox和类别,语义分割或者实例分割是预测每个像素的类别 ...

  8. 技术图文:进一步完善自动化交易系统 - 04

    背景 我们在 数字资产量化中的三角套利策略 这篇图文中详细的介绍了三角套利的原理以及代码实现. 在 进一步完善自动化交易系统 - 02 和 进一步完善自动化交易系统 - 03 中利用配置文件的方法,扩 ...

  9. 技术图文:进一步完善自动化交易系统 - 03

    背景 在 进一步完善自动化交易系统 - 02 这篇图文中,向大家详细介绍了,满足以下两个条件下: 拥有数字资产:BTC.EOS.USDT.ONE BigOne 提供交易对:ONE-USDT.ONE-E ...

最新文章

  1. Nature子刊:微生物系统的功能与功能冗余
  2. SAP各种凭证的取消小结
  3. 学习笔记(26):Python网络编程并发编程-GIL与自定义互斥锁的区别
  4. DDD(领域驱动设计)
  5. 构建Docker直觉
  6. Docker学习总结(53)—— Docker 十个非常实用但又容易忽视的使用技巧
  7. 不定宽高的DIV,垂直水平居中
  8. WPF:在XmlDataProvider上使用主-从绑定(Master-Detail Binding)
  9. 图标和文字跟着div比例放大缩小_【方法技巧】高考地理越来越重视基本概念的考查,看高中地理如何考查比例尺的判读和应用,附专项练习...
  10. Atitit.数据采集器 dataspider
  11. 紫光扫描仪ocr_紫光OCR文字识别软件
  12. 利用python提取SWAT模型output.rch中固定sub编号的逐月径流到Excel
  13. 图解项目管理详细流程全景图
  14. python|文本文件的处理
  15. lombok 基础注解之 @Cleanup
  16. CodeForces-1138A
  17. 大风车吱呀吱悠悠地转
  18. 【vue】【开源】vue开源电商项目hello-mall嗨喽商城
  19. 哪位人兄..做过flex 打开 DWG DWF 文件程序
  20. 浅谈目前小说站所谓的服务能力和未来的发展盈利

热门文章

  1. java数组冒泡排序
  2. 让arduino支持nuvotom新唐
  3. 逍遥安卓显示无法连接服务器,逍遥安卓云服务器安装
  4. Kotlin入门-嗯,我有别名,什么名称都变短
  5. 关于百度编辑器UEditor中图片手机端自适应,手机端展示的图片超出屏幕的问题
  6. 获取设备UDID等设备信息
  7. 图片人脸检测——Dlib
  8. springboot配置swagger
  9. Windows10安装linux子系统
  10. “大数据成就大电商”主题沙龙在京召开