文章目录

  • 一、背景
  • 二、动机
  • 三、方法
    • 3.1 Boundary Patch Extraction
    • 3.2 Boundary Patch Refinement
    • 3.3 Learning and Inference
  • 四、实验


Paper: https://arxiv.org/abs/2104.05239
Code: https://github.com/tinyalpha/BPR

一、背景

实例分割:

  • 给图片中的每个目标生成一个带有类别信息的 pixel-wise 的 mask
  • 目前比较流行的是 Mask RCNN 系列,也就是使用 Faster-RCNN 检测目标,然后使用 mask 分支来对box内部进行二类别的分割。

现有的实例分割的mask的质量仍然不尽如人意(图1左),边界很粗糙,而且没有对齐目标边界。原因主要有两个

  • 特征图的分辨率太小,mask rcnn 的是 28x28,[38][43]的是输入图像的1/4,导致细小的边界都消失了,预测出来的都是粗糙或不明确的。
  • 边界像素所占的比例太少,少于 1% [18],而且本来就很难分类,所以,同等的看待所有的pixels可能会导致优化偏向于目标内部区域,边界区域效果较差。

如果能提升目标边界附近的效果,那么可以较大的提升实例分割的效果。

作者做了一个上限实验,在边界附近特定距离时(1px/2px/3px),使用真实的标签来代替预测的结果,AP 有较大的提升。

二、动机

现有方法中,也有很多通过引入边界分支来提升对边界分割的效果,但这些也依赖于对边缘的准确预测,作者认为实例的边界预测和实例分割的复杂度是不相上下的。

受启发于分割真值的标注,标注人员在标注局部细小边界时,需要放大原图进行标注,在标注大边缘时,不需要放大即可标注。

故本文提出了一个在概念上很简单,但很有效的方法:crop-then-refine。

  • 得到一个粗糙的mask后,首先沿着 boundaries 抽取一系列的子块
  • 将mask的patch和抽取出来的boundaries patch进行concat,共同送入 refinement 网络(BPR, boundary patch refinement)。

上述方法可以解决:

  • 1、小的patch就可以保存高分辨率
  • 2、小的patch中的边界像素占比会提升,缓解之前的极度不平衡

三、方法

3.1 Boundary Patch Extraction

作者使用 sliding window 的方法提取边界 patch,即以边界为中心,密集的生成正方形框,然后使用 NMS 滤掉部分框

3.2 Boundary Patch Refinement

Mask Patch:

Boundary Patch Refinement Network:

该网络的目的是实现对每个 boundary patch 的二类分割,只要使用任意一个语义分割网络,实现输入4路(RGB+1 binary mask patch),输出2类即可。

作者选择了 HRNetV2 来作为 refinenet,可以保证高分辨率的保持。

Reassembling: refine 之后,使用这些patch来代替没有refine之前的patch,对于重叠的相邻区域,对其取均值后,使用阈值判断,如果大于0.5则判断为前景,否则判断为背景。

3.3 Learning and Inference

训练时,作者仅仅抽取那些预测的mask和gt的iou大于0.5的实例的boundary patch。但所有预测的实例在 inference 阶段都会保留。

模型输出是被从 gt 中提取出的 mask patch 监督的,之后做逐点的二分类cross-entropy损失。

训练时,作者的 NMS 阈值设置为 0.25,inference 时会根据速度的需要来选择不同的阈值。

四、实验

经过消融实验后,作者使用如下的超参数:

  • 使用mask patch

  • boundary patch 抠图大小为 64x64,且无 padding

  • 送入 refinement network 的patch被resize为 256x256的效果最好

  • NMS:0.55时取得了好的效果

【实例分割】cvpr2021_Look Closer to Segment Better相关推荐

  1. “先粗后精”的实例分割,BPR:使用Crop-then-Refine的性能提高方法

    题目:Look Closer to Segment Better:Boundary Patch Refinement for Instance Segmentation 论文:https://arxi ...

  2. CVPR目标检测与实例分割算法解析:FCOS(2019),Mask R-CNN(2019),PolarMask(2020)

    CVPR目标检测与实例分割算法解析:FCOS(2019),Mask R-CNN(2019),PolarMask(2020) 目标检测:FCOS(CVPR 2019) 目标检测算法FCOS(FCOS: ...

  3. 何恺明团队推出Mask^X R-CNN,将实例分割扩展到3000类

    翻译 | AI科技大本营(ID:rgznai100) 参与 | shawn,刘畅 今年10月,何恺明的论文"Mask R-CNN"摘下ICCV 2017的最佳论文奖(Best Pa ...

  4. 【每周CV论文】初学实例分割需要读哪些文章?

    欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 实例分割(Instance Segmenta ...

  5. 【图像分割模型】实例分割模型—DeepMask

    这是专栏<图像分割模型>的第11篇文章.在这里,我们将共同探索解决分割问题的主流网络结构和设计思想. 本文介绍了用于实例分割任务的模型结构--DeepMask. 作者 | 孙叔桥 编辑 | ...

  6. 实例分割:MaskXRCnn 与Visual Genome数据集

    一.VG数据集 机器学习领域的突破突然让计算机获得了以未曾有的高精度识别图像中物体的能力--几乎达到了让人惊恐的程度.现在的问题是机器是否还能更上层楼,学会理解这些图片中所发生的事件. Visual ...

  7. 语义分割和实例分割_一文读懂语义分割与实例分割

    以人工智能为导向的现代计算机视觉技术,在过去的十年中发生了巨大的变化.今天,它被广泛用于图像分类.人脸识别.物体检测.视频分析以及机器人及自动驾驶汽车中的图像处理等领域.图像分割技术是目前预测图像领域 ...

  8. 线性插值改变图像尺寸_【图像分割模型】实例分割模型—DeepMask

    这是专栏<图像分割模型>的第11篇文章.在这里,我们将共同探索解决分割问题的主流网络结构和设计思想. 本文介绍了用于实例分割任务的模型结构--DeepMask. 作者 | 孙叔桥 编辑 | ...

  9. 在英特尔独立显卡上部署YOLOv5 v7.0版实时实例分割模型

    作者:贾志刚 英特尔物联网创新大使 目录 1.1 YOLOv5实时实例分割模型简介 1.2 英特尔®消费级锐炫™ A 系列显卡简介 1.3  在英特尔独立显卡上部署YOLOv5-seg模型的完整流程 ...

最新文章

  1. window.postMessage实现网页间通信
  2. 计算机网络日,《计算机网络原理》教学日历[汇编].pdf
  3. 洛谷 - P1989 无向图三元环计数(思维建图)
  4. 数据字典怎么写_求职数据分析,项目经验该怎么写
  5. 60-400-045-使用-binlog-Maxwell读取MySQL binlog日志到Kafka
  6. Ubuntu 截屏(或截图)
  7. idea调代码时返回到上一步的快捷键
  8. 一路走好——稻盛和夫先生
  9. 从内观修行的角度看正念疗法
  10. 《黄昏清兵卫》中学到的工作态度
  11. 微信小程序的广告方式有哪些
  12. javaSE探赜索隐四<基本排序算法>
  13. java正态分布随机数_正态分布的随机数
  14. 测试环境搭建(APP)
  15. docker(5):容器
  16. 余数的数学定义和性质
  17. 两电源之间接0.1UF的电容起什么作用?
  18. 群策CRM解决方案,直击系统集成行业风口
  19. 人类基因组本地化及简单分析
  20. 金工如何运用计算机思维,金工实心得.doc

热门文章

  1. Java5:BigInteger、BigDecimal详解
  2. 多列集合的索引器实现
  3. javaWEB学习之filter
  4. URAL 1225 Flags
  5. 二叉排序树的C++实现(过程式)
  6. robots.txt文件详解
  7. GridView空记录时显示Header和Footer
  8. 微软MCP之SharePoint2007考试试题(Microsoft 70-542)
  9. 2020年蓝桥杯比赛时间_我院举办2021年创新创业大赛启动仪式及第12届蓝桥杯动员大会...
  10. 三星Note3水货/行货各版本区别 N900/N9002/N9005/N9006/N9008/N9009有什么不同