全文共6531字,预计学习时长13分钟

图片来源:pexels.com/@gravitylicious

生成对抗网络(GAN)是生成模型的一种神经网络架构。

生成模型指在现存样本的基础上,使用模型来生成新案例,比如,基于现存的照片集生成一组与其相似却有细微差异的新照片。

GAN是使用两个神经网络模型训练而成的一种生成模型。其中一个称为“生成器”或“生成网络”模型,可学习生成新的可用案例。另一个称为“判别器”或“判别网络”,可学习判别生成的案例与实际案例。

两种模型(从博弈论的意义上来说)处于一种竞争状态,生成器企图愚弄判别器,而判别器则要同时处理生成案例和实际案例。

经学习,生成模型可生成所需的新案例。

生成对抗网络具有极为具体的使用案例,一开始这些案例理解起来会有些困难。

本文将回顾大量GAN的有趣应用,有助于你了解其能够解决的案例类型。以下列表或许并不完整,但其中包含了许多媒体介绍过的GAN使用案例。

应用案例可划分为以下18种类型:

1. 生成图像数据集案例

2014年,Ian Goodfellow等人发表论文《对抗式生成网络》,提出了生成新案例这一应用。文中指出,GAN可为MNIST手写数码数据集、CIFAR-10小件图片数据集、多伦多人像数据集生成新案例。

论文传送门:https://arxiv.org/abs/1406.2661

GAN可为图像数据集生成新案例。图片来自《生成对抗网络》。

2015年,Alec Radford等人在一篇重要论文《使用深度回旋生成对抗网络进行无监督表示学习》,也表达了类似观点。论文指出,深度回旋生成对抗网络展示了大规模培养稳定GAN的方法。论文展示了生成卧室新案例的模型。

论文传送门:https://arxiv.org/abs/1511.06434

GAN根据图像数据集生成的卧室新案例。图片来自《生成对抗网络》。

同时,论文展示了GAN(在潜在空间中)运行向量运算的能力,只需输入生成的卧室案例和人像案例即可。

GAN进行向量运算的案例。图片来自《使用深度回旋生成对抗网络进行无监督表示学习》。

2. 生成人脸照片

Tero Karras等人在2017年发表的论文《GAN质量、稳定性及变化性的提高》展示了生成人脸照片的案例,照片十分逼真。因此,论文引起了媒体的广泛关注。生成照片时以名人的脸作为输入,导致生成的案例具有名人的脸部特征,让人感觉很熟悉,却并不认识。

论文传送门:https://arxiv.org/abs/1710.10196

GAN生成人脸照片的案例。图片来自《GAN质量、稳定性及变化性的提高》。

该方法同样用于生成物品和场景案例。

GAN生成物品和场景的案例。图片来自《GAN质量、稳定性及变化性的提高》。

2018年发表的报告《人工智能的恶意使用:预测、预防及抑制》选用的也是以上案例,显示了2014至2017年GAN的快速发展。

论文传送门:https://arxiv.org/abs/1802.07228

2014至2017年GAN的快速发展。图片来自《人工智能的恶意使用:预测、预防及抑制》。

3. 生成现实照片

Andrew Brock等人在2018年发表了题为《用于高保真自然图像合成的GAN规模化训练》的论文。论文展现了用BigGAN技术生成合成照片的案例。案例照片几乎与真实照片无异。

论文传送门:https://arxiv.org/abs/1809.11096

用BigGAN技术生成合成照片的案例。图片来自《用于高保真自然图像合成的GAN规模化训练》。

4. 生成动画角色

金杨华(音译)等人于2017年发表了题为《用GAN生成动画角色》的论文。论文展示了如何训练及应用GAN来生成动画头像(如日本动漫人物)。

论文传送门:https://arxiv.org/abs/1708.05509

GAN生成动画人脸的案例。图片来自《用GAN生成动画人物》。

受动画角色案例的启发,一些人试图利用GAN生成Pokemon这样的角色,比如pokeGAN项目和使用深度回旋GAN生成Pokemon项目。但目前成效甚微。

GAN生成口袋妖怪角色案例。图片来自pokeGAN项目。

5. 图像转换

GAN在这方面几乎无所不能,因为相关论文显示GAN可以执行许多图像转换任务。

Phillip Isola等人于2016年发表题为《使用GAN技术进行图像转换》的论文。论文特别介绍了如何使用GAN的pix2pix技术进行图像转换。

论文传送门:https://arxiv.org/abs/1611.07004

以下是一些图像转换案例:

· 将语义图像转化成城市和建筑景观图片

· 将卫星图像转化成谷歌地图

· 将白天景观转化成夜晚景观

· 将黑白图片转化成彩色图片

· 将素描转化成彩色图片

使用pix2pix技术进行图片日夜转换的案例。图片来自《使用GAN技术进行图像转换》。

使用pix2pix技术将素描转化成彩色图片。图片来自《使用GAN技术进行图片转化》。

朱俊彦等人于2017年发表题为《使用一致循环生成网络进行非配对图像转换》的论文。论文介绍了著名的CycleGAN技术以及大量图片转化的案例。

论文传送门:https://arxiv.org/abs/1703.10593

以下是一些图像转换案例:

· 将图片转化成艺术绘画风格

· 将马的图片转化成斑马图

· 将夏景转化成冬景

· 将卫星图转化成谷歌地图

使用CycleGAN技术进行图片转化的四个案例。图片来自《使用一致循环生成网络进行非配对图片转化》。

论文还介绍了其它案例,如:

· 将画作转化成图片

· 将素描转化成图片

· 将苹果图转化成橙子图

· 将照片转化成艺术画作

使用CycleGAN技术将画作转化成照片的案例。图片来自《使用一致循环生成网络进行非配对图片转化》。

6. 文字-图片转化

Han Zhang等人于2016年发表题为《StackGAN:使用堆叠GAN技术进行文字-图片转化及合成》的论文。论文特别介绍了如何运用StackGAN将对于简单物体(如花鸟)的文字描述转化为现实图片。

论文传送门:https://arxiv.org/abs/1612.03242

将鸟类文本描述转化成现实图片的案例。图片来自《StackGAN:使用堆叠GAN技术进行文字转图片转化及合成》。

Scott Reed等人于2016年发表了题为《使用GAN技术合成图像》的论文。论文介绍了把对花、鸟等物体的文本描述转化为图像的案例。

论文传送门:https://arxiv.org/abs/1605.05396

将花鸟文本描述转化成现实图片的案例。图片来自《使用GAN技术合成图片》。

Ayushmen Dash等人于2017年发表了题为《TAC-GAN——受文本限制的辅助分类器GAN》的论文。文中介绍了几近相同的数据集案例。

论文传送门:https://arxiv.org/abs/1703.06412

Scott Reed等人于2016年发表了题为《学习绘画内容和地点》的论文。论文对GAN的此功能作了进一步介绍,并运用GAN完成文图转化,以及运用包围盒和关键点推测描绘物体(如一只鸟)的位置。

论文传送门:https://arxiv.org/abs/1610.02454

文图转化的案例及GAN提供的位置信息。图片来自《学习绘画内容和地点》。

7. 语义图像-图片转化

Ting-Chun Wang等人于2017年发表了题为《使用条件性GAN进行高清图片合成及语义操纵》的论文。文中介绍了使用条件性GAN根据语义图像或素描生成现实图片的方法。

论文传送门:https://arxiv.org/abs/1711.11585

语义图像及GAN生成城市景观照片的案例。图片来自《使用条件性GAN合成高保真图片及语义操纵》。

具体案例如下:

· 根据语义图像合成城市景观图片

· 根据语义图像合成卧室图片

· 根据语义图像合成人脸图片

· 根据素描合成人脸图片

论文同时介绍了一种可操纵所生成图片的互动编辑器。

8. 生成正面人像图片

Rui Huang等人于2017年发表了题为《人脸转正:全球及地方GAN感知合成拟真正面人像图片》的论文。文中介绍了使用GAN根据特定角度的人脸生成正面人像图片(如脸朝前)的方法。此类技术可应用于人脸验证或辨认系统。

使用GAN生成正面人像的案例。图片来自《人脸转正:使用全球及地方GAN感知合成拟真正面人像图片》。

9. 生成新体态

Liqian Ma等人于2017年发表了题为《人体体态图像生成》的论文。文中介绍了生成人体模型新体态的案例。

论文传送门:https://arxiv.org/abs/1705.09368

人体模型新体态的案例。图片来自《人体体态图像生成》。

10. 图片转表情

Yaniv Taigman等人于2016年发表了《无监督跨领域图像生成》一文介绍了使用GAN跨领域转化图像的方法。比如,将街区数字转化为MNIST手写数码,或将名人照片转化为emoji或动画表情。

论文传送门:https://arxiv.org/abs/1611.02200

将名人照片转化为emoji表情的案例。图片来自《无监督跨领域图像生成》。

11. 图片编辑

Guim Perarnau等人于2016年发表了题为《使用可逆条件性GAN编辑图片》的论文。文中特别介绍了使用GAN的IcGAN技术根据特定的面部特征如发色、发型、表情甚至性别变化来重建人像图片的方法,比如:

使用IcGAN技术编辑人脸图片的案例。图片来自《使用可逆条件性GAN编辑图片》。

论文传送门:https://arxiv.org/abs/1611.06355

Ming-Yu Liu等人于2016年发表了题为《耦合性GAN》的论文。文中同样介绍了如何利用发色、表情和眼镜等特征生成面部图片。论文同时也展示了其他图像的生成,如有颜色和深度变化的场景图片。

论文传送门:https://arxiv.org/abs/1606.07536

使用GAN生成有或无金发的人像图片案例。图片来自《耦合性GAN》。

Andrew Brock等人于2016年发表了题为《使用IAN进行神经图片编辑》的论文。文中介绍了一种运用多种变化性自动编码器及GAN的面部照片编辑器。此种编辑器可以快速对人脸特征进行修改,包括修改发色、发型、表情、体态,以及增补面部胡须。

论文传送门:https://arxiv.org/abs/1609.07093

基于VAE和GAN使用神经图片编辑器修改面部特征的案例。图片来自《使用IAN进行神经图片编辑》。

He Zhang等人于2017年发表了题为《使用条件性GAN消除图片中的雨》的论文。文中介绍了如何使用GAN编辑图片,比如消除图片中的雨雪。

论文传送门:https://arxiv.org/abs/1701.05957

使用GAN消除图片中的雨的案例。图片来自《使用条件性GAN消除图片中的雨》。

12. 面部老化

Grigory Antipov等人于2017年发表了题为《使用条件性GAN进行面部老化处理》的论文。文中介绍了使用GAN生成不同年龄段人脸图片的方法。

论文传送门:https://ieeexplore.ieee.org/document/8296650

使用GAN生成不同年龄段的人脸图片的案例。图片来自《使用条件性GAN进行面部老化》。

Zhifei Zhang等人于2017年发表了题为《使用条件性对抗自动编码器增龄/减龄》的论文。文中介绍了使用GAN对面部图片进行减龄处理的方法。

论文传送门:https://arxiv.org/abs/1702.08423

使用GAN对面部图片进行减龄处理的案例。图片来自《使用条件性对抗自动编码器增龄/减龄》。

13. 图片混合

Huikai Wu等人于2017年发表了题为《GP-GAN:关于现实高保真照片的混合》的论文。文中展示了GAN在混合照片,尤其是混合田野、大山及其大型物体照片中的应用。

论文传送门:https://arxiv.org/abs/1703.07195

使用GAN混合图片的案例。图片来自《GP-GAN:关于现实高保真照片的混合》。

14. 超分辨率

Christian Ledig等人于2016年发表了题为《使用GAN生成单幅高分辨率图像》的论文。文中特别展示了GAN的SRGAN模型在生成具有超高分辨率图像中的应用。

论文传送门:https://arxiv.org/abs/1609.04802

使用GAN生成超高分辨率图片的案例。图片来自《使用GAN生成高分辨率现实单图》。

Huang Bin等人于2017年发表了题为《使用条件性GAN生成具有高质量、超高分辨率的面部图像》的论文。文中特别展示了GAN在构建不同版本人脸图像中的应用。

论文传送门:https://arxiv.org/abs/1707.00737

生成高分辨率人脸图像的案例。图片来自《使用条件性GAN生成高质量超高分辨率面部图像》。

Subeesh Vasu等人于2018年发表了题为《使用强化超高分辨率感知网络分析扭曲认知的折中参数》的论文。文中展示了一个使用GAN构建街景高分辨率图片的案例。

论文传送门:https://arxiv.org/abs/1811.00344

使用GAN生成高分辨率建筑图片的案例。图片来自于《使用强化超高分辨率感知网络分析扭曲认知的哲衷参数》。

15. 图片修复

Deepak Pathak等人于2016年发表了题为《文本编码器:通过图片修复学习特征》的论文。论文特别介绍了如何使用GAN的文本编码器进行图片修复或填充空缺,即填补图片中某块缺失的部分。

论文传送门:https://arxiv.org/abs/1604.07379

使用文本编码器修复图片的案例。图片来自《文本编码器:通过图片修复学习特征》。

Raymond A. Ye等人于2016年发表了题为《使用深度生成模型修复语义图像》的论文。文中介绍了如何用GAN对故意损坏的人脸图像进行填充和修复。

论文传送门:https://arxiv.org/abs/1607.07539

使用GAN修复人脸图像的案例。图片来自《使用深度生成模型修复语义图像》。

Yijun Li等人于2017年发表了题为《人脸图像生成性填充》的论文。文中同样介绍了如何使用GAN对损坏的人脸图像进行修复和重建。

论文传送门:https://arxiv.org/abs/1704.05838

使用GAN重建人脸图像的案例。图片来自《人脸图像生成性填充》。

16. 服装转化

Donggeun Yoo等人于2016年发表了题为《像素级领域转化》的论文。论文展示了如何根据身着服装的模特照片,运用GAN生成类似服装图集或线上服装店的服装图片。

论文传送门:https://arxiv.org/abs/1603.07442

输入图片及使用GAN生成服装图片的案例。图片来自《像素级领域转化》。

17. 视频预测

Carl Vondrick等人于2016年发表了题为《生成场景动态视频》的论文。文中介绍了如何使用GAN进行视频预测,尤其是连续预测最长可至一秒的视频帧,聚焦于场景中的静态因素。

论文传送门:https://arxiv.org/abs/1609.02612

使用GAN生成视频帧的案例。图片来自《生成场景动态视频》。

18. 3D打印

吴佳俊等人于2016年发表了题为《通过3D生成对抗模型学习物体形状的可能潜在空间》的论文。论文展示了如何使用GAN生成物体的3D模型,比如桌椅、汽车和沙发。

论文传送门:https://arxiv.org/abs/1610.07584

使用GAN生成3D模型的案例。图片来自《通过3D生成对抗模型学习物体形状的可能潜在空间》。

Matheus Gadelha等人于2016年发表了题为《由2D物体视图推导3D形状》的论文。文中介绍了如何使用GAN根据多种视角的2D物体图像生成3D模型。

论文传送门:https://arxiv.org/abs/1612.05872

由2D椅子视图重建其3D模型的案例。图片来自由《2D物体视图推导3D形状》。

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货

编译组:张雨姝、张婷华

相关链接:

https://machinelearningmastery.com/impressive-applications-of-generative-adversarial-networks/

如需转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017 论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

海量案例!生成对抗网络(GAN)的18个绝妙应用相关推荐

  1. [论文阅读] (06) 万字详解什么是生成对抗网络GAN?经典论文及案例普及

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  2. DL之GAN:生成对抗网络GAN的简介、应用、经典案例之详细攻略

    DL之GAN:生成对抗网络GAN的简介.应用.经典案例之详细攻略 目录 生成对抗网络GAN的简介 1.生成对抗网络的重要进展 1.1.1986年的RBM→2006年的DBN

  3. 万字详解什么是生成对抗网络GAN

    摘要:这篇文章将详细介绍生成对抗网络GAN的基础知识,包括什么是GAN.常用算法(CGAN.DCGAN.infoGAN.WGAN).发展历程.预备知识,并通过Keras搭建最简答的手写数字图片生成案. ...

  4. 一文看懂「生成对抗网络 - GAN」基本原理+10种典型算法+13种应用

    生成对抗网络 – Generative Adversarial Networks | GAN 文章目录 GAN的设计初衷 生成对抗网络 GAN 的基本原理 GAN的优缺点 10大典型的GAN算法 GA ...

  5. 【GAN优化】长文综述解读如何定量评价生成对抗网络(GAN)

    欢迎大家来到<GAN优化>专栏,这里将讨论GAN优化相关的内容,本次将和大家一起讨论GAN的评价指标. 作者&编辑 | 小米粥 编辑 | 言有三 在判别模型中,训练完成的模型要在测 ...

  6. [Python图像识别] 四十九.图像生成之什么是生成对抗网络GAN?基础原理和代码普及

    该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门.OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子.图像增强技术.图像分割等,后期结合深度学习研究图像识别 ...

  7. [Python人工智能] 二十九.什么是生成对抗网络GAN?基础原理和代码普及(1)

    从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章分享了Keras实现经典的深度学习文本分类算法,包括LSTM.BiLSTM.BiLSTM+Attention和CN ...

  8. [人工智能-深度学习-59]:生成对抗网络GAN - 基本原理(图解、详解、通俗易懂)

    作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客 本文网址:https://blog.csdn.net/HiWangWenBing/article/detai ...

  9. [人工智能-深度学习-63]:生成对抗网络GAN - 图片创作:普通GAN, pix2pix, CycleGAN和pix2pixHD的演变过程

    作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客 本文网址:https://blog.csdn.net/HiWangWenBing/article/detai ...

  10. 生成对抗网络(GAN)简单梳理

    作者:xg123321123 - 时光杂货店 出处:http://blog.csdn.net/xg123321123/article/details/78034859 声明:版权所有,转载请联系作者并 ...

最新文章

  1. AI语音算法“个性”强 与芯片端“磨合”挑战多
  2. Solr debugQuery使用体会
  3. - -(我最近的开发..)
  4. nginx怎么轮询两台php,Nginx 配置轮询分流-实现负载均衡【测试通过】
  5. 操作系统进程管理实验java_计算机考研操作系统进程管理
  6. LoadRunner性能测试-思考时间
  7. 强连通分量 Kosaraju PK Tarjan(转)
  8. Android中AppWidget的分析与应用:AppWidgetProvider .
  9. 超级强大的鼠标手势工具
  10. 天龙八部手游有网络显示网络或服务器异常,天龙八部手游微信登录不了_微信登录异常解决办法_玩游戏网...
  11. 深入V8引擎-Time核心方法之mac篇
  12. HTTP 压力测试工具 wrk和ab
  13. 编写单片机中断程序的注意事项 成都电气开发
  14. linux用命令行快速切换目录
  15. 超有用:记一次Yapi上传报错及其处理方式
  16. 涉密计算机病毒库升级管理,涉密计算机管理制度.doc
  17. 极简浏览器主页网址导航自定义网址壁纸云端同步简洁清爽
  18. 3D Experience — 产品协同研发平台
  19. Win10-更改c盘下的用户文件夹名[转]
  20. java求循环节长度

热门文章

  1. 浅谈unsigned与signed的区别
  2. 威科达科技—资深工程师关于防治干扰的秘籍分享
  3. 分辨率和像素是什么关系?
  4. ubuntu 16.04 安装apollo3.0(发布版)
  5. 推荐系统中评测指标准确率和召回率
  6. 信道编码与交织(理论与MATLAB实现)
  7. memcpy函数用法
  8. pip安装gunicorn_gunicorn安装报错
  9. pdf怎么转换txt?转换渠道一览
  10. window10下拯救者笔记本RTX3060laptop配置CUDA11.0 pytorch版详解