因为目前StyleGAN生成的都是虚拟人物,如果我们能找到现实人物在初始域中对应的编码的话,那就意味着可以对现实中的人物进行操作和变化,这会带来一个很有意思的场景:我们每个人的人脸都可以用一个(18,512)维度的向量来表示,并且只要对这个向量稍作一些变动,就能生成出一个略微不同于我们的新的人脸模样(如下图所示)。

  我们认为这个想法是有意义的,因为这意味着虚拟人物的生成能与现实人物产生依托或关联。首先有必要从理论上来简单解释一下这个想法——虽然我们无法保证StyleGAN的生成分布域涵盖了地球上所有人脸的样貌,但是由于StyleGAN的生成基于分级控制特征,并且训练集涵盖了人种、性别、年龄等各种样式的人脸,因此我们可以在生成分布中找到一张与现实人脸无比接近的人脸,并最终计算出其在初始域中对应的编码。

  上图便解释了实际要做的事情,下面开始设计模型以实现这一想法。既然要做图像提取特征码,我们首先想到可以借鉴BiGAN(双向GAN)的思维,简言之就是加一个编码器,将生成器的输出当作输入,并将生成器的输入当作输出去进行训练,下面展示一个基于ResNet50模型设计的编码器。

上图是编码器的内部结构,主要是在ResNet50的模型后面加上几个转换层(添加较多的转换层有利于将图像特征转换为隐空间编码),实现上是比较容易的。
下面来看一下训练和测试的流程

  如上图所示,训练时采用StyleGAN提供的源源不断的样本(该样本最好加上一些噪音,因为测试时获得的图片往往是不清晰的,而用有噪音的图片训练出的模型更容易在测试图片上获得好效果),得到一个预训练模型。不过考虑到这是在生成图片域上的训练,而在测试时我们用到的是真实图片,因此对于特定的图片还需要进行二次调整(迭代优化),才能找到它在初始分布域上的准确位置(参考的论文在这里,也可以查看译文)。下面展示一个测试效果,采用的是一张我本科同学的照片,发现基于StyleGAN重构生成的图片能与原图达到非常高的重合性。

  我还进一步做了很多实验,主要是在大量明星名人的头像上,发现StyleGAN的复原效果是很惊艳的,不仅肖像人物、肖像背景都能基本贴合原图,而且对于粗糙肖像图的重构还能提升其画质。下面展示两张玛丽莲梦露和杨幂的重构生成图片。

如何实现现实人脸照片的编码相关推荐

  1. 人脸照片自动生成游戏角色_ICCV2019论文解析

    人脸照片自动生成游戏角色_ICCV2019论文解析 Face-to-Parameter Translation for Game Character Auto-Creation 论文链接: http: ...

  2. 2块钱就能买上千张人脸照片?央视曝光AI黑产,产业链太惊人了

    贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 「一张人脸照片,只值0.002元,2元钱就能买到上千张」: 「不法分子用公民照片,加上AI换脸技术,直接登录金融app-..」 这些,都是 ...

  3. facebook人脸照片_如何处理Facebook上的不良照片

    facebook人脸照片 Not everyone is model pretty and capable of posing perfectly on a split second's notice ...

  4. 本周AI热点回顾:30行代码,让27吨发电机原地爆炸;Photoshop把AI论文demo打包实现了;2块钱就能买上千张人脸照片

    点击左上方蓝字关注我们 01 Photoshop把AI论文demo打包实现了:照片上色.改年龄.换表情只需要点点鼠标 这两年,我们从很多论文中看到过一些令人惊艳的 demo,比如老照片自动上色.低画质 ...

  5. 工厂用抽象类比接口_用简单的现实类比解释硬编码概念

    工厂用抽象类比接口 by Samer Buna 通过Samer Buna 用简单的现实类比解释硬编码概念 (Hard Coding Concepts Explained with Simple Rea ...

  6. 清华大学提出APDrawingGAN,人脸照片秒变艺术肖像画

    作者 | 刘永进教授 来源 | 转载自数据派THU(ID:DatapiTHU) 清华大学提出APDrawingGAN,该项工作被CVPR 2019录取为oral paper.CVPR是计算机视觉和人工 ...

  7. 经典回顾 | 人脸照片秒变艺术肖像画:清华大学提出APDrawingGAN CVPR 2019 oral paper...

    该项工作被CVPR 2019录取为oral paper.CVPR是计算机视觉和人工智能领域内的国际顶级会议,2019共收到投稿5160篇,录取1300篇,其中oral paper288篇,仅占全部投稿 ...

  8. 人脸照片秒变艺术肖像画:清华大学提出APDrawingGAN CVPR 2019 oral paper

    该项工作被CVPR 2019录取为oral paper.CVPR是计算机视觉和人工智能领域内的国际顶级会议,2019共收到投稿5160篇,录取1300篇,其中oral paper288篇,仅占全部投稿 ...

  9. CVPR 2019 | 人脸照片秒变艺术肖像画:清华大学提出APDrawingGAN

    该项工作被CVPR 2019录取为oral paper.CVPR是计算机视觉和人工智能领域内的国际顶级会议,2019共收到投稿5160篇,录取1300篇,其中oral paper288篇,仅占全部投稿 ...

  10. facebook人脸照片_为什么您的Facebook照片看起来如此糟糕(以及您可以如何做)...

    facebook人脸照片 Facebook is a popular platform for sharing photos, even though it's not a very good one ...

最新文章

  1. 赛灵思:人工智能芯片发展方向与误区
  2. Django中html里的分页显示
  3. 程序员面试的一些心得
  4. 【LeetCode】0103.二叉树的锯齿形层序遍历
  5. Web前端工程师的一些常见误区介绍!
  6. php 接口缓存,php写的一个缓存接口demo,兼容redis和memcache
  7. 如何用Linux命令行管理网络:11个你必须知道的命令
  8. MySQL学习(二)
  9. IDEA Maven项目添加本地jar包
  10. 计算机取证之你必须要会用的24款工具
  11. QCC3040---battery module
  12. idea查看java类方法_用IntelliJ IDEA看Java类图的方法(图文)
  13. php机器人聊天对话框,PHP实现QQ聊天机器人
  14. c语言 公交卡一卡通系统,公共交通一卡通系统
  15. 【直击】腾讯SaaS加速器首期复试现场:122位CEO争夺30席入场券,激烈!
  16. 遍历二叉树的神级方法
  17. [SSL_CHX][2021-8-19]空瓶换饮料
  18. CSS重置默认样式reset.css代码模板
  19. linux tar压缩排除某个文件夹
  20. Linux中如何添加自己的路径到PATH

热门文章

  1. 语音推送提醒php,实时语音后台通知消息 - 百度免费的tts实现后台实时在线语音消息提醒 – 基于ThinkPHP和Bootstrap的极速后台开发框架...
  2. ubuntu16.04 修改本机密码
  3. msys2 预编译的包 查询和下载
  4. css布局Absolute的垂直水平居中
  5. Java-密钥keytool及KeyStore的使用
  6. 两个苹果手机共享步数_最新刷步教程 | 蚂蚁森林如何快速刷步数,获得296g能量...
  7. while(条件) 语句;语句 容易理解错的一点
  8. 线性代数 --- 带有置换矩阵P的LU分解
  9. java官方网站下载_java下载 7.0 官方版
  10. php tcp utp链接,【黑帽seo】php随机调用友情链接技术