2021-Semantic Image Matting
目录
1. Title
2. Summary
3. Problem Statement
(1)Matting经典公式
(2)Matting的隐含原因
4. Method(s)
(1)Dataset
Matting Classes
Comparison with Other Matting Datasets
Analysis
(2)Framework
Patch-Based Classifier
Encoder-Decoder Structure
Multi-Class Discriminator
Content-Sensitive Weights
(3)Losses
5. Evaluation
(1)与其他方法的比较
(2)消融实验
6. Conclusion
1. Title
Semantic Image Matting
2. Summary
本文相较于之前的Matting方法来说,创造性地引入了20个Matting Classes,或者某种意义上说是20种Matting Pattern,这样一来,对于每个image来说,可以额外引入一些类别信息,辅助Matting的进行。
首先,由于一个image中可能存在多个Matting Classes,因此,需要先将未知区域划分为多个Patch,然后基于Patch训练一个分类器,分类结果再产生一个Class Activate Map,多个Matting Classes的CAM以及原来的Trimap拼接在一起,即得到了Semantic Map。
最终,Semantic Map和RGB图片送入编解码器中进行Alpha的预测,同时由于多了Matting Classes信息,可以额外引入一些类别信息作为监督信号辅助训练。
3. Problem Statement
(1)Matting经典公式
本文要解决的问题的领域为Image Matting。
传统方法主要是依赖于图片的颜色或者是结构等低级特征,这种方法缺失了前景目标或背景场景的语义信息,当前景像素与背景像素深度混合时,便无法获得可信的分类结果。
深度神经网络可以一定程度上缓解传统方法的问题,并且在一些特定领域例如人像、透明物体的Matting任务中取得了一定的成果。
(2)Matting的隐含原因
尽管常规的Matting公式可以应用于复杂的场景中,但是由于前景语义信息的过于丰富,目前还没有工作尝试去分析Matting产生的潜在原因是什么。
目前的深度学习方法仍然只是使用data-level的语义信息,而没有去考虑Matting产生的本质原因是什么,对于同一个前景物体来说,不同的边界、模式都是可能存在的。
4. Method(s)
本文提出将Matting Region的语义分类引入Matting Framework中,以更好地提取Alpha Mattes。
首先,本文基于Regional Matting Patterns,将其聚类为20个不同的Matting Classes。
然后,通过考虑将Unknown Region对应的Matting Class置信度图,将传统的Class-Agnostic Trimap转化为Semantic Trimap。
最后,Semantic Trimap和原始的RGB图一起作为输入送入网络中进行Alpha Mattes的预测。
同时,本文还添加了一个Multi-Class Discriminator作为额外的监督,以提供语义信息的正则化约束。
(1)Dataset
Matting Classes
尽管现在存在很多大型Matting数据集,但是通过分析,其大体可以分为20种模式,即Matting Classes。
基于以上20个类别,本文重新收集整理了一个数据集——Semantic Image Matting Dataset,其包含726个训练前景和89个测试前景,并且都来自以上20种Matting Classes。背景则以一种在线获取的方式随机从COCO数据集中获取。测试集则是将测试前景与来自PASCAL VOC的10个背景组合而成。
Comparison with Other Matting Datasets
相较于其他Matting数据集来说,Semantic Image Matting数据集在20个Matting Classes上分布更加均匀:
Analysis
通过对Alpha Mattes的平均Gradient Magnitude和前景未知区域Alpha Ratio在20个Matting Classes的分布可以看出,不同的类别在梯度和ratio上存在着一定的差异,因此,充分挖掘Matting Classes信息将有利于Alpha Mattes的生成。
(2)Framework
FRamework整体结构为一个Encoder-Decoder结构,其输入来自于两个方面,一个是RGB图片,另一个是Semantic Trimap,输出则是Alpha Prediction。网络整体通过Multi-Class Discriminator、Reconstruction 和 Gradient-Related loss三个部分进行监督。
Patch-Based Classifier
Semantic Trimap是一个常规Trimap和一个n-channel的Score Maps的拼接,n则是Matting Classes的数量。
常规Trimap只会定义三个部分:绝对前景、绝对背景以及未知区域,而Score Maps则会定义未知区域属于某个Matting Classes的置信度。
由于一个Alpha Image通常包含多个Matting Classes,因此,需要将其划分为多个Patch,每个Patch仅属于一个Matting Classes。
训练时,随机对未知区域进行裁剪,得到一个方形patch,Classifier将该patch对应的常规Trimap的部分分为Matting Classes,并最终通过Class Activation Map计算其对应各个类别的置信度图Score Maps。
Encoder-Decoder Structure
整体结构基于UNet,在UNet的neck部分添加了一个ASPP模块用于聚合不同感受野的特征,Decoder则通过三个独立的预测头,分别预测F,B和α。
Multi-Class Discriminator
Multi-Class Discriminator带来的正则化作用将会使得模型去更好地学习各个类别的特征,从而给出更合理的预测,具体见下图:
Multi-Class Discriminator将在训练整个网络之前预训练好,在训练整个网络时,该部分参数冻结,仅作为一个正则化部分,训练过程与Semantic Trimap Classifier类似。
Multi-Class Discriminator主要通过classification loss and feature reconstruction loss两个损失对网络进行正则化。
Content-Sensitive Weights
经典Matting公式及其对应的梯度为:
对于一个未知区域来说,F-B和α都是未知的,因此可以使用网络对其进行学习,以引入额外的正则化信息:
其中λ1和λ2都是2D可学习权重。
(3)Losses
多种损失用于提供丰富的监督信号。
- Reconstruction Losses
- Classification and Feature Reconstruction Loss
- Gradient-related Loss
- Image Leaking Loss
- Total loss
5. Evaluation
本文采用了四种常用评估指标:the sum of absolute differences (SAD), mean square error (MSE), the gradient error (Grad) and the connectivity error (Conn)。
(1)与其他方法的比较
(2)消融实验
6. Conclusion
本文总结了20个Matting Classes,并基于这20个类别,将传统的Trimap转化为了Semantic Trimap,以提供更为丰富的语义信息,通过引入额外的监督信号,提升了alpha的预测精度。
2021-Semantic Image Matting相关推荐
- 【Image Matting】Semantic Human Matting
[MM 18] Semantic Human Matting Paper : https://arxiv.org/pdf/1809.01354.pdf 摘要 首次实现无需Trimap方式生成alpha ...
- 论文阅读:Semantic Human Matting
论文地址:https://arxiv.org/pdf/1809.01354.pdf 内容简介 这个网络是用来做人像抠图的(Matting),只能抠人不能抠别的 制作了一个很大的高质量人像抠图数据集(5 ...
- 【SHM】Semantic Human Matting抠图算法调试
前言: 2018年阿里的论文<Semantatic Human Matting>给出了抠图领域的一个新方法,可惜阿里并没有公布源码,而牛人在Github上对这个论文进行了复现,我也是依赖G ...
- CVPR 2021 论文和开源项目合集(Papers with Code)
摘自:https://github.com/amusi/CVPR2021-Papers-with-Code CVPR 2021 论文和开源项目合集 CVPR 2021 论文和开源项目合集(Papers ...
- Image Matting 客观评价指标、数据集及主观评价
Image Matting 客观评价指标.数据集及主观评价 2021.7更新 PPM-100数据集已经开放,GitHub,详情见下文章节2.4 目录 Image Matting 客观评价指标.数据集及 ...
- 图像抠图Image Matting算法调研
目录 1.Trimap和Strokes 2. 相关数据集 3.论文算法调研 3.1 Deep Image Matting 3.2 Semantic Image Matting 3.3 Backgrou ...
- 一键抠图Portrait Matting人像抠图 (C++和Android源码)
一键抠图Portrait Matting人像抠图 (C++和Android源码) 目录 一键抠图Portrait Matting人像抠图 (C++和Android源码) 1. 项目介绍: 2. MOD ...
- 人像分割 X Image Matting(更新 2020/2/13)
目录 写在前面 一.人像语义分割 (1) PortraitNet (改善loss) (2) Boundary-aware Instance Segmentation (3) Pose2Instance ...
- 基于阿里Semantatic Human Matting算法,实现精细化人物抠图
人像抠图 基于深度学习技术研发的人像抠图技术.可识别视频图像中的人像区域,包括头部.半身.全身位置,抠出人像部分后,配以不同背景图片.效果,实现娱乐化需求,支持用户玩转更多个性化操作,常用于直播.视频 ...
最新文章
- 还是分了的好——看惠普、赛门铁克拆分
- java红牛农场答案_Java面向对象程序设计实验指导与习题解答(21世纪高等学校计算机专业实用规划教材)...
- 《数据库SQL实战》查找薪水涨幅超过15次的员工号emp_no以及其对应的涨幅次数t
- qt 嵌入web页面_Qt嵌入浏览器(三)——QWebEngine与Https
- day5 模拟用户登录
- vlc-qt编译 linux,记录一次搞vlc官方源码中Qt示例工程的过程,文件路径对话框
- -bash: mysql: command not found解决方法(zabbix监控mysql失败)
- python 引用文件中的类 报错_Python学习笔记7 头文件的添加规则(转载)
- linux内核zfs,Linus Torvalds 不建议使用 ZFS On Linux
- Linux 操作memcache命令行
- Proteus 里面library文件夹找不到,怎么找到library文件夹。
- 怎么把PDF文件转换成电子书?教你如何转换
- 前端怎么把word文档转换成HTML格式
- 关于“应用程序正常初始化(0xc0150002)失败”问题的解决方案
- 网关 Gateway
- Xposed系列--技巧篇
- osgEarth的Rex引擎原理分析(一二四)osgEarth着色器文件与场景树节点的对应关系
- c语言 万能函数指针,C/C++编程笔记:C语言精华解析之void *指针,指针中的万能指针...
- 世唐科技:大数据应用案例,告诉你最真实的大数据故事
- 人脸识别 face identification CMC曲线