GAN逆映射(GAN Inversion)实际上是逆向思维的极佳范式。简单来说,以往将编码z通过生成器合成图像;现在是求真实图像的编码,期望在特征空间的修改最终映射为对图像语义的修改,比如将人脸图像的属性进行修改(表情变为微笑、戴上眼镜等)。

论文回顾

这篇论文全名为"Style Transformer for Image Inversion and Editing",模型训练后可以一键修改人脸的各种属性(表情、头发、眼睛等)

前置知识讲解

这篇论文涉及到了GAN逆映射(GAN Inversion),理解这个概念是理解本论文的关键,下面将从神经网络开始,逐步递进。

神经网络

神经网络的结构主要有输入层,隐藏层,输出层构成,输入层需要根据特征数目来决定,输出层 根据解决的问题来决定,隐藏层的网路层数以及每层的神经元数就是可以调节的参数。

卷积神经网络(CNN)

卷积运算可视化如动图所示,其中灰色3*3的区域为卷积核,左侧虚线区域为图像(简化),右侧区域为运算结果。运算过程为卷积核与当前图像重叠区域的每个数值相乘后求和,卷积核从左往右、从上往下进行移动。

生成对抗网络(GAN)

生成对抗网络(英语:Generative Adversarial Network,简称GAN)是非监督式学习的一种方法,通过让两个神经网络相互博弈的方式进行学习。生成对抗网络由一个生成网络与一个判别网络组成。

生成网络从潜在空间(latent space)中随机取样作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。

而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。

GAN逆映射(GAN Inversion)

生成式对抗网络(GANs)虽然目前可以合成高质量的图像,但无法直接把这些训练好的模型做为先验信息,直接应用于真实图像编辑。为了让训练好的GAN能用于处理图像,可以尝试重新反向传播(寻找合适的Z)或者添加一个额外的编码器encoder将图像映射到潜在空间。当然除了这两种途径外,还有不少优化方法。

说到GAN逆映射,不得不提香港中文大学周博磊老师团队的工作"Image Processing Using Multi-Code GAN Prior"。周老师的论文提出一种新的逆映射(image->Z)方法,将训练好的GAN作为一个有效的先验去处理多种图像处理任务。具体而言,给定需要做逆映射的GAN模型,基于多个编码Z利用GAN模型生成多个特征图(映射到生成器的某个中间层),接着对它们加权组合生成目标图像。这种方式可以明显提升图像的重建质量。高质量图像重建作为一种先验信息,可以用在许多真实场景,比如:图像编辑、超分辨率、图像修复等。

资源下载

本论文涉及的代码和模型权重(国外网盘),已打包放入百度网盘。关注公众号实用AI客栈,在后台回复1002即可获取下载链接。

实用AI客栈

分享人工智能领域最新资讯,讲解各类实用的算法和模型。

原理剖析(续)

讲完了论文前置知识,论文详细原理将在下一篇公众号文章中展开。如有疑问,欢迎在评论区留言。

CVPR2022新作:P图不会,深度学习来帮忙,基于GAN逆映射的图像编辑(中)相关推荐

  1. CVPR2022新作:P图不会,深度学习来帮忙:基于GAN逆映射的图像编辑(上)

    导 语 人脸图像编辑广泛应用于图像后期处理中,通常使用PS工具通过多个步骤来完成.手动完成人像的后期编辑非常耗时,同时对工具的娴熟运用会有较高的学习门槛.下面让我们看下如何用AI一键修图. 本文效果 ...

  2. 【论文翻译】HCGN:面向集体分类的异构图卷积网络深度学习模型

    HCGN:面向集体分类的异构图卷积网络深度学习模型 摘要 集合分类是研究网络数据的一项重要技术,旨在利用一组具有复杂依赖关系的互联实体的标签自相关性.随着各种异构信息网络的出现,集合分类目前正面临着来 ...

  3. 视频教程-2019年人工智能热门案例精讲之P图美化照片-深度学习

    2019年人工智能热门案例精讲之P图美化照片 香港大学硕士.任职经历包括微软中国(Microsoft),今日头条研发中心,联想香港人工智能中心以及联合国亚太分部.现主要工作是利用深度学习实现基于知识图 ...

  4. 深度学习入门:基于Python的理论与实现①

    深度学习入门:基于Python的理论与实现① 机器学习的三大要素 第一章python入门 1.Numpy 1.1.numpy的N维数组 1.2.numpy广播 1.3访问元素 2.Matplotlib ...

  5. 【深度学习】【物联网】深度解读:深度学习在IoT大数据和流分析中的应用

    作者|Natalie 编辑|Emily AI 前线导读:在物联网时代,大量的感知器每天都在收集并产生着涉及各个领域的数据.由于商业和生活质量提升方面的诉求,应用物联网(IoT)技术对大数据流进行分析是 ...

  6. 【深度学习】深度解读:深度学习在IoT大数据和流分析中的应用

    来源:网络大数据(ID:raincent_com) 摘要:这篇论文对于使用深度学习来改进IoT领域的数据分析和学习方法进行了详细的综述. 在物联网时代,大量的感知器每天都在收集并产生着涉及各个领域的数 ...

  7. 深度学习实战篇-基于RNN的中文分词探索

    深度学习实战篇-基于RNN的中文分词探索 近年来,深度学习在人工智能的多个领域取得了显著成绩.微软使用的152层深度神经网络在ImageNet的比赛上斩获多项第一,同时在图像识别中超过了人类的识别水平 ...

  8. 学习《深度学习入门:基于Python的理论与实现》高清中文版PDF+源代码

    入门神经网络深度学习,推荐学习<深度学习入门:基于Python的理论与实现>,这本书不来虚的,一上来就是手把手教你一步步搭建出一个神经网络,还能把每一步的出处讲明白.理解神经网络,很容易就 ...

  9. 【深度学习入门:基于Python的理论与实现】书本学习笔记 第三章 神经网络

    文章目录 1. 阶跃函数的实现 2. 函数图形 2.1 阶跃函数 2.2 sigmoid 函数 2.3 ReLU 函数 3. 多维数组的运算 3.1 矩阵乘法 3.2 神经网络的内积 4. 三层神经网 ...

最新文章

  1. perl 如何更新_Perl 进度条模块
  2. viewpager 无网络的时候滑动异常
  3. Nature论文爆出千行Python代码Bug,或影响百篇学术论文
  4. 迪拜与IBM合作推出基于区块链的商业注册系统
  5. python巡检脚本juniper_JUNIPER设备日常维护巡检命令
  6. 一些前端开发的代码审查和意见
  7. My Brute(HDU-3315)
  8. 锁——死锁——单个锁锁死
  9. 初学者web前端知识点--HTML部分
  10. 【LeetCode】剑指 Offer 36. 二叉搜索树与双向链表
  11. redis mysql qps_14_redis如何通过读写分离来承载读请求QPS超过10万+?
  12. 利用getData获取图片中的图表信息数据
  13. minitab学习系列(2)--CPK、PPK案例解析
  14. 娓娓道来图模型、图查询、图计算和图学习知识
  15. 易经读书笔记16 雷地豫
  16. 工业物联网的实际应用案例以及技术分析
  17. IDEA运行项目时停不下来
  18. C#_串口调试助手-扫描可用串口
  19. 运动耳机有必要买吗、口碑最好的运动耳机品牌排行
  20. “GitHub: Your account has been flagged.”的完美解决方法

热门文章

  1. 创造与魔法java语言_《创造与魔法》食谱大全
  2. Java 8 的异步编程利器 CompletableFuture 真香!
  3. 图像仿射变换原理2:矩阵变换、线性变换和图像线性变换矩阵
  4. 【扫盲】什么是回程网络(backhaul network )、计算图优化
  5. 什么是32位单片机?32位单片机有哪些优点和缺点?8位,16位,32位是什么区别?
  6. 小程序订阅消息授权总结
  7. 浪潮服务器性能测试,内存、IO子系统性能测试_浪潮服务器_服务器评测与技术-中关村在线...
  8. 浪潮NF5280M5刷写新的FRU
  9. SQL 创建临时表并导入到新表中
  10. python--摄氏温度和华氏温度的互相转换