点击上方“机器学习与生成对抗网络”,关注星标

获取有趣、好玩的前沿干货!

来源:arXiv  编辑:新智元 Priscilla 好困

【新智元导读】上海科技大学和加州大学圣地亚哥分校的研究人员提出了一种新的人像生成系统,不仅能够单独控制人像中的不同属性,还能让用户从无到有即时创建出一个彩色的人像。

大家都知道,用GAN可以进行人像的生成。

但在GAN学习的潜在空间里,人的姿势、形状和纹理样式等不同属性通常都是结合在一起的。

那么想控制某个特定部位的属性怎么办?

为此,来自上海科技大学和加州大学圣地亚哥分校的研究团队就提出了名为「SofGAN」的人像生成系统。

论文地址:https://arxiv.org/pdf/2007.03780.pdf

项目地址:https://apchenstu.github.io/sofgan/

这个系统将人像的潜在空间解耦为两个子空间:几何空间和纹理空间。

从两个子空间采样的潜在代码分别馈送到两个网络分支:一个生成具有规范姿势的肖像的3D几何图形,另一个生成纹理。

对齐的3D几何还带有语义部分分割。

编码为语义占用字段SOF,能够在任意视图上渲染一致的2D语义分割图。

然后将其与生成的纹理图融合,使用语义实例(SIW)模块,处理为人像照片。

也就是说,这个系统可以单独控制人像的头发、眼睛、眼镜、皱纹和肤色,生成高质量肖像图像。

这个方法还可以推广到各种应用中,例如制作外观一致的面部动画和动态造型。

解耦表征

这项工作的主要贡献是「解开」已学到的面部特征,例如姿势和纹理,这样SofGAN也可以生成与不正对相机的视角的图像。

作者从图像渲染系统中吸取灵感,提出了将图像场景解耦为几何空间和纹理空间的方法。

同时将传统的占用字段扩展到语义占用字段(SOF)以模拟肖像几何。

SOF描述了每个空间点在k语义类上的概率分布,包括头发、脸、脖子、衣服等。

用SofGAN合成图像步骤:

  1. 对SOF进行光线跟踪,从给定的用户特定视点获得2D分割图。

  2. 采用GAN生成器,从纹理空间采样的样式代码对每个语义区域进行纹理化。

  3. 提出语义实例(SIW)纹理模块支持动态和区域样式控制。

解耦表征能够显式控制姿势、形状和纹理样式。

从原图像开始,在第二列的图像中改变了人物的头部姿势、面部轮廓和纹理样式。

而第三列则是从不完整的segmap中生成交互式图像,用户能够逐部分添加到segmap,并即时生成彩色图像。

SIW-StyleGAN的特点之一就是语义级别的样式控制。

也就是能够根据指定的语义分割图进行区域样式调整,单独控制每个语义区域的样式。

SofGAN还可以根据全局、背景、肤色、头发等语义区域生成不同的图像。

SofGAN框架可以通过改变相机角度,从几何样本或真实图像中生成自由视点的人像图像。

SOF使用多视图语义分割图进行训练,视图之间的几何投影约束在SOF中编码,这样就能够在改变视点时保持人像的形状和表情一致。

此外,用户还能从无到有,用户逐一将各部分添加到segmap,即时生成彩色图像。

比如用哈利波特演员Daniel Radcliffe作为跟踪模板画一个人出来。

当然,这些都只是生成了静态的图像。

SofGAN还能生成动态图像。

看上去也是十分自然,非常逼真。

效果怎么样?

经过三天训练,1500次迭代,SofGAN生成的图像与英伟达的Spade和PixPixHD以及SEAN等方法相比,从单个分割图中获得的图像更逼真。

SofGAN能够生成逼真图像,因为它有以下三个特点:

1. 对单个属性进行显示控制,其余属性保持不变。

因此SofGAN可以支持相应的渲染效果,比如自由视点渲染、全局和区域样式调整、面部变形、表情编辑等。

2. 训练未配对的数据。

与之前需要使用配对/对其RGB和分割图像进行训练的方法不同,SIW模块可以使用未配对的真实世界图像和合成语义分割图直接进行训练。

3. 按需和交互式生成。

SofGAN生成器的定制架构能够从不准确甚至不完整的分割图中合成逼真的人像。因此,用户能够从一个界面像Photoshop的工具,为交互式肖像设计手绘语义轮廓。

而综合实验表明,在CelebA和FFHQ数据集上,SofGAN图像生成器都达到了SOTA FID和LPISP分数,可用于广泛的综合任务。

参考资料:

https://arxiv.org/pdf/2007.03780.pdf

猜您喜欢:

等你着陆!【GAN生成对抗网络】知识星球!  

CVPR 2021 | GAN的说话人驱动、3D人脸论文汇总

CVPR 2021 | 图像转换 今如何?几篇GAN论文

【CVPR 2021】通过GAN提升人脸识别的遗留难题

CVPR 2021生成对抗网络GAN部分论文汇总

经典GAN不得不读:StyleGAN

最新最全20篇!基于 StyleGAN 改进或应用相关论文

超100篇!CVPR 2020最全GAN论文梳理汇总!

附下载 | 《Python进阶》中文版

附下载 | 经典《Think Python》中文版

附下载 | 《Pytorch模型训练实用教程》

附下载 | 最新2020李沐《动手学深度学习》

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 | 超100篇!CVPR 2020最全GAN论文梳理汇总!

附下载 |《计算机视觉中的数学方法》分享

SofGAN:更逼真可控的肖像生成器相关推荐

  1. 【论文笔记】—生成对抗网络—GAN—2014-NIPS

    论文介绍 生成对抗神经网络GAN开山之作论文. 论文作者为"生成对抗网络之父"Ian Goodfellow和图灵奖得主Youshua Bengio. GAN近年来成为人工智能和深度 ...

  2. NIPS 2017录用论文先睹为快!论文作者清华专场分享(附PPT下载)

    来源:雷锋网 作者:杨文 本文长度为3500字,建议阅读8分钟 本文为你详细整理GAIR大讲堂NIPS清华专场干货内容. NIPS背景 NIPS是由连接学派(connectionist)神经网络的学者 ...

  3. 论文翻译:MichiGAN: Multi-Input-Conditioned Hair Image Generation for Portrait Editing

    论文地址:https://arxiv.org/pdf/2010.16417.pdf 文中所有图片与表格统一移动至了文末 MichiGAN:用于人像编辑的多输入条件头发图像生成 摘要 尽管最近利用GAN ...

  4. 学习知识汇总(持续更新......)

    章节 内容 常用 Colab使用教程 csdn博客编辑教程目录 新版CSDN编辑器示例(代码及显示样式) 如何快速转载CSDN中的博客 B站视频资料汇总 系统 windows10和安装linux双系统 ...

  5. 上科大提出:对抗神经网络 动态人像系统SofGAN!

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:新智元 AI博士笔记系列推荐 周志华<机器学习>手推笔记正式开源!可打印版本附pdf下载链接 大家 ...

  6. 超模脸、网红脸、萌娃脸...换头像不重样?我开源了5款人脸生成器

    出品 | AI科技大本营(ID:rgznai100) 英伟达近日提出的新一代 StyleGAN,通过对 StyleGAN 的生成效果分析,他们对不完美的工作设计了改进和优化方法,使得生成图片的质量和效 ...

  7. 这款开源的人脸生成器,我爱了!

    公众号关注 "GitHubDaily" 设为 "星标",每天带你逛 GitHub! 转自 AI 科技大本营 如今,用 StyleGAN 技术制作出的人脸应用层出 ...

  8. Fedora 提出统一流程,弃用上千 Python 2 软件包更可控

    开发四年只会写业务代码,分布式高并发都不会还做程序员? >>>   Fedora 社区正在讨论弃用 Python 2 软件包的统一流程. https://pythonclock.or ...

  9. 4年4篇顶刊顶会论文!清华开源肖像线条画生成代码,惟妙惟肖模仿人类作画...

      视学算法报道   编辑:好困 [新智元导读]近日,清华大学提出的非成对人脸照片肖像线条画生成方法,被IEEE Transactions on Pattern Analysis and Machin ...

最新文章

  1. 序列密码体制——密码学笔记(三)
  2. 《深入理解Kafka:核心设计与实践原理》笔误及改进记录
  3. C++常用排序法、随机数
  4. 不加入域不能访问域资源
  5. android-circlebutton介绍
  6. 深度学习优化算法大全系列5:AdaDelta,RMSProp
  7. 工业标准接口OPC Server
  8. web打印控件|打印预览
  9. 台湾自由行可行性研究报告
  10. 海豚蓝牙ASIO驱动程序使用说明
  11. 扒一扒网易云课堂python课程,发现还有不少可以白嫖的免费好资源
  12. java 拉姆达表达式_Java8中foreach与拉姆达表达式的组合使用
  13. 计算机网络 | 实验二 WINPCWP编程
  14. 中水是什么?有什么用途呢?
  15. ExifTool 抽取、修改Image tag 信息
  16. 坑逼的PL2303与WIN11
  17. 通俗易懂的讲讲TCP的三次握手
  18. 非此即彼的逻辑错误_英语逻辑错误一览
  19. 分布式调度框架Elastic-Job和xxl-job区别
  20. r语言知识点(课件)

热门文章

  1. nuxt.js中的静态图片显示不出来解决方法
  2. 【ArcGIS微课1000例】0028:ArcGIS根据属性快速分割生成多个shp文件
  3. Kanguru推出独立于操作系统的新型加密指纹访问闪存驱动器,在竞争中脱颖而出
  4. php一级标题红色字体,什么是一级标题
  5. 计薪日21.75和工作日20.83是如何算出来的,有什么区别
  6. Python变量数据类型、输入输出
  7. 为Java程序员准备的Go语言入门PPT
  8. 有时候狗比人更有人性
  9. Logo设计潮流之非主流风格
  10. 解决[WinError 10048] 通常每个套接字地址(协议/网络地址/端口)只允许使用一次