论文链接:Textured Neural Avatar
CMU Panotic dataset链接:CMU Panoptic Dataset

完成的工作:video to video translation,从输入的有限角度图片合成任意viewpoint的、与输入不同pose的image sequence,即video

问题:
1、如何获得input pose?
CMU Panoptic数据集自带骨骼点数据。对于其他的数据集,先对单目RGB视频的前五帧应用Openpose得到五个2D pose,再lift得到第五帧时的3D pose
2、如何获得ground-truth foreground mask(计算mask的loss时要用)?
用DeepLabv3+生成,用GrabCut来refine

Methods

1、Input and Output

输入:image (视频中的一帧),以及对应image 的map stack 包括了image 中pose的信息。中的每个map 包含第块“火柴人”的骨头在相机平面上的投影(也就是说,被第块骨头覆盖的pixel在中对应的值非零,其余pixel在中对应的值为零)。每块骨头覆盖的区域(segment)是由关节点确定的,关节点有横纵坐标和深度坐标,而segment内的普通点没有深度坐标,因此对每个segment里的普通点的深度坐标进行线性插值,并据此确定中对应的值

输出:一个RGB image(three-channel stack) 和一个mask(single-channel stack)

2、Baseline

Image-to-image translation network,使用 fully-convolutional architecture直接将映射到。此文具体选用了一个video-to-video的变体来作为baseline

3、Textured Neural Avatar

上述baseline的系统强烈依赖于全卷积结构,而几乎没有使用任何domain-specific的知识。此文对纹理(texture)进行显式建模(怎么显式建模?),从而保证身体各个部分在不同姿势下纹理的一致性。

此文的方法参考了DensePose,将body分成=24个部分,每个body part都有一个2D参数。此外,每个body part都有一个texture map (实际上就是UV贴图),其大小是预先设置的,此文中为256256。参数表示第个body part。Input image中的每一个pixel都被assign到24个body part中的一个或者background里,结果用(stack of body assignment stack)表示。同时得到每个pixel在body part内部的坐标,结果用(stack of body part coordinate)表示。DensePose使用image来估计assignment和coordinate,而本文仅使用了

由n+1个map组成,map内元素非负。 表示image中的一点  属于第  个body part或background的概率( 为background),且有 

由2个map组成,map内元素为0~之间的实数。为texture map  的尺寸,此处=256。 和  表示 image中的一点在第  个body part中的坐标

系统输出image 可以用texture element加权表示:

其中函数是sampling function,其输出就是(当然,最终的输出结果需要多次回馈、迭代)。在非整数处,采用双线性插值

此文通过训练得到跟据预测的网络以及网络参数有两个分支:。为了训练参数,要计算loss并回馈到,使得每一次迭代不仅更新网络参数,也更新纹理。

对mask的训练也要计算与ground-truth mask之间的loss,回馈迭代

4、Textured Neural Avatar的初始化

此文表示网络模型初始化参数对于3D重建的成功非常重要。初始化有两种方式:
1、先把input放到DensePose里跑一边得到output,然后训练一个translation network  between input and DensePose output作为初始
2、Transfer learning,由于不同人体之间有差异但差异不大,可以使用别的data训练出来的作为初始

接着对进行初始化。对于input image中每个pixel,根据得到其body part assignment,根据得到其对应的texture pixel(不是一一映射)。每个texture pixel的值(RGB)被初始化为映射到它的image pixel的均值,没有被image pixel映射到的texture pixel初始化为黑色。

画了张图完整表示这套系统的工作流程:

Textured Neural Avatars 论文方法简述相关推荐

  1. CV方向介绍 | 基于自然语言的跨模态行人ReID的SOTA方法简述(下)

    点击我爱计算机视觉标星,更快获取CVML新技术 本文为52CV群友Jokie对ReID一个新的子方向最新总结,原载于知乎: https://zhuanlan.zhihu.com/p/89730837 ...

  2. Procedural Noise Adversarial Examples for Black-Box Attacks on Deep Neural Networks论文笔记

    Procedural Noise Adversarial Examples for Black-Box Attacks on Deep Neural Networks论文笔记 0. 概述 如今一些深度 ...

  3. Sequence to Sequence Learning with Neural Networks论文翻译

    Sequence to Sequence Learningwith Neural Networks论文翻译 摘要 深度神经网络是在困难的学习任务中取得卓越性能的强大模型.尽管拥有大量的标记训练集,DN ...

  4. 简述isodata算法的原理_基于UWB技术的室内定位方法简述

    1. UWB室内定位概述: UWB室内定位技术与传统通信技术有极大的差异,它不需要使用传统通信体制中的载波,而是通过发送和接收具有纳秒或纳秒级以下的极窄脉冲来传输数据,从而具有GHz量级的带宽.超宽带 ...

  5. 谷歌浏览器的下载位置如何设置 Chrome浏览器下载路径设置方法简述

    在Chrome地址栏输入"chrome://settings/"后回车; 谷歌浏览器的下载位置如何设置?Chrome浏览器下载路径设置方法简述 谷歌浏览器的下载位置如何设置?Chr ...

  6. 猎豹浏览器小号窗口怎么打开 小号窗口打开方法简述

    针对同一用户在同一浏览器中同时登录多个不同网络账号的需求,猎豹浏览器贴心的推出了一项特别的功能--"小号窗口".那么,猎豹浏览器的小号窗口要怎么打开呢?下面小编就简单介绍一下猎豹浏 ...

  7. 傲游浏览器怎么更换皮肤 浏览器皮肤更换方法简述

    再好看的浏览器皮肤,看得久了也会让人感觉无味.而在这个时候,不少人都会选择换种皮肤.换个心情!那么,傲游浏览器要怎么更换皮肤呢?下面小编就来简单介绍一下傲游浏览器皮肤更换的方法,不清楚具体方法的朋友可 ...

  8. 360浏览器怎么收藏网页 360安全浏览器快速收藏网页方法简述

    不少网友都有将一些常用的网站收藏在浏览器中的习惯,以便下次快速打开该站点或找寻.那么,在360浏览器中该怎么收藏网页呢?下面小编就来简单介绍一下360安全浏览器快速收藏网页的方法,有需要的朋友可以稍作 ...

  9. 傲游浏览器怎么看网页源代码 网页源代码查看方法简述

    网页源代码,顾名思义就是指在网页制作过程中需要用到的一些特殊的"语言",设计人员向通过对这些"语言"进行组织编排制作出网页,再由浏览器进行"翻译&qu ...

最新文章

  1. linux安装oem环境,【OEM】 oem12c_install_for_linux
  2. 关系型数据库,第一!
  3. (1) 使用supervisor提高nodejs调试效率
  4. 【转】搭建Java版WebService
  5. 新手应该如何Javascript,JDom,JQuery,DWZ。。
  6. JAVA基础学习预科部分 (Markdown + dox)2021/2/22持续更新中
  7. HtmlHelper扩展 及 页面编码化
  8. 华为鸿蒙os系统电脑有吗,华为全面启用鸿蒙OS系统!所有华为终端设备:默认搭载鸿蒙系统...
  9. php二叉树层序遍历 带层数和不带层数 需要用到队列
  10. 阿里回应被列为被执行人;Linus Torvalds:我已经不是程序员;Ant Design 4.4.1 发布 | 极客头条
  11. C# 类(11) 密封类.
  12. Java编程常用的软件有哪些
  13. WordPress仿站工具构建网页时踩坑
  14. python魔兽挂机_实现 WOW 插件的简单步骤
  15. 统一社会信用代码正则校验
  16. 2021年汽车驾驶员(技师)考试题及汽车驾驶员(技师)找解析
  17. NET Namespace(1)
  18. 项目管理:如何使用甘特图制定项目计划
  19. 园区/厂区怎么实现wifi上网短信认证
  20. 韩顺平老师讲解13个自学编程的坑

热门文章

  1. mysql 开窗函数 累加_开窗函数在MySql中的使用
  2. mysql当前日期减去天数,有没有一种方法可以从MySQL中的日期中减去天数?
  3. 慕课网app下拉刷新图标填充效果的实现
  4. java音乐_java实现简单音乐播放器
  5. Elasticsearch日期格式化
  6. OpenCV学习(30) 轮廓defects
  7. EventArgs 解释
  8. Git客户端Fork使用
  9. 从程序员到项目经理(二十二):以德服人才能口服心服
  10. 计算机四级考试如何备考?