论文阅读Instance-aware semantic segmentation via Multi-task Network Cascades

论文信息:CVPR2016, PASCAL VOC in VGG 63.5% mAP. COCO2015 in resnet101 won first prize

整体框架:对于传统的多任务方法,都是在共享特征的基础上,每个任务同时进行各不干扰,互相独立。这篇文章是在共享特征的基础上,上一个任务依赖于下一个任务,如此形成级联式的多任务结构(Multi-task Network Cascade,MNC)。

三个任务:(1)Differentiating instances;(2)Estimating masks;(3)Categorizing objects;

使用VGG16的第13层卷积层特征作为共享特征。每个阶段包含一个loss,下一阶段的loss依赖于前一阶段loss,故三个阶段的loss都不是独立的。

任务一:differentiating instance-->regressing box-level instances ,该阶段的主要任务找出所有可能的物体框,即使用Faster RCNN中的RPN网络,使用NMS得到 top-ranked 300个box;

这一阶段的主要实现就是在共享特征的基础上附加一个3*3的卷积层用于降维以及1*1的卷积用于目标框定位和目标分类。因此在这一阶段的loss,作者直接使用的是RPN的loss,即:

任务二:estimating masks-->regressing mask-level instances,该阶段的主要任务是以共享特征和上一阶段的得到的bounding box作为输入,输出基于box的pixel-level 的mask,不过此时的mask是class-agnostic,即无法对mask进行类别区分。

这一阶段的主要实现是在task1 输出的不同大小的box上使用ROI warping Pooling产生固定大小的特征:14*14大小的feature map,在此基础上为每个box附加两个fc层:fc1(256)+fc2(m*m,28*28),这里的28*28是预先设定的mask的分辨率。因此这一阶段的task不仅是依赖于mask还依赖于box,所以这一阶段的loss,即:

任务三:categorizing objects-->categorizing instances,该阶段的主要任务是以共享特征,task1的box,task2的mask作为输入,输出每个instance的categories scores。

这一阶段的主要实现是,一方面,在ROI warping pooling 的基础上连接两个fc层:fc1(4096)+fc2(4096);另一方面对task2得到的mask 也连接两个fc层:fc1(4096)+fc2(4096);然后再对这两个通道进行concat,最后得到每个instance的得分。因此这一阶段的计算量比较大,也是导致整个MNC模型巨大的原因。这一阶段的loss,如下:

End-to-end training

整个MNC网络结构的loss function如下:

MNC主要的技术挑战就是对上面的loss function 如何可以应用链式法则进行反向传播,实现end-to-end training。在fast R-CNN论文中使用的RoI pooling 的预测框是经过预训练的,是固定的,它的反向传播只考虑F(Θ) ,但我们现在必须同时考虑Bi(Θ),而在这里得到的预测框确实在不断变化。但是,实际上task2中的框是由task1给出的,那么task2的loss就不只是依赖mask,还依赖框。这导致了无法对这部分以end to end的方式来训练,因为无法同时对这两部分求导。

为了解决上述问题,作者把ROI pooling分为了两部分:ROI warping 与 pooling。ROI warping的具体实现可以看原文。

阅读笔记:Instance-aware semantic segmentation via Multi-task Network Cascades相关推荐

  1. JSNet: Joint Instance and Semantic Segmentation of 3D Point Clouds

    Abstract 在本文中,我们提出了一种新的联合实例和语义分割方法,称为JSNet,以同时解决3D点云的实例和语义分割.首先,我们建立了一个有效的骨干网络来从原始点云中提取鲁棒的特征.其次,为了获得 ...

  2. ECCV2020语义分割——Self-Prediction for Joint Instance and Semantic Segmentation of Point Clouds

    Self-Prediction for Joint Instance and Semantic Segmentation of Point Clouds Abstract (一) Introducti ...

  3. 语义分割--Large Kernel Matters--Improve Semantic Segmentation by Global Convolutional Network

    Large Kernel Matters–Improve Semantic Segmentation by Global Convolutional Network https://arxiv.org ...

  4. Robust semantic segmentation by dense fusion network on blurred vhr remote sensing images

    Robust semantic segmentation by dense fusion network on blurred vhr remote sensing images 说明se的设计还是很 ...

  5. 论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering,SENet,用于大规模子空间聚类的自表达网络

    论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering. SENet--用于大规模子空间聚类的自表达网络 前言 摘要 ...

  6. Semi-supervised Semantic Segmentation with Error Localization Network(基于误差定位网络的半监督语义分割 )

    Semi-supervised Semantic Segmentation with Error Localization Network(基于误差定位网络的半监督语义分割 ) Abstract 本文 ...

  7. 【论文笔记】Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspectivewith Transformers

    声明 不定期更新自己精度论文,通俗易懂,初级小白也可以理解 涉及范围:深度学习方向,包括 CV.NLP.Data Fusion.Digital Twin 论文题目: Rethinking Semant ...

  8. 论文笔记:Integrating Semantic Segmentation and Retinex Model for Low Light Image Enhancement

    来源:Proceedings of the 28th ACM International Conference on Multimedia (2020) 目录 Contributions Mothol ...

  9. 论文笔记-SSF-DAN: Separated Semantic Feature based Domain Adaptation Network for Semantic Segmentation

    论文信息 论文标题:SSF-DAN: Separated Semantic Feature based Domain Adaptation Network for Semantic Segmentat ...

最新文章

  1. SAP WM 针对采购订单收货时候不能自动获取物料主数据里的Special Movement Indicator?
  2. 【深度学习】图像自动处理工具SimpleITK的使用(Python)
  3. unix,linux,windows 哪个更好,更适合做服务器
  4. React篇-报错信息:warning: Can't call setState (or forceUpdate) on an unmounted component.
  5. LeetCode:汇总区间【228】
  6. 【排错】net::ERR_ABORTED 404
  7. oracle constraint_type 问题
  8. 实际电压/流源模型及其等效分析
  9. osgEarth用户手册
  10. Js——event详解
  11. sdut 数据结构实验之二叉树六:哈夫曼编码
  12. linux手动生成dump文件权限不足_linux下生成dump文件方法及设置
  13. 23个实用 Javascript Tab导航插件
  14. 什么标签用于在表单中构建复选框_基础表单标签及属性
  15. Linux多线程工作笔记0004---C语言中g++ -o -c -g 功能
  16. json.parser性能_Jackson JSON Java Parser API示例教程
  17. 读书:海明威的《老人与海》
  18. php session 设置无效
  19. Atitit 艾提拉总结的操作硬件解决方案 目录 1.1. Atitit 列出wifi热点以及连接 1 1.2. 剪贴板 1 1.3. 屏幕 触摸与截屏 1 1.4. 性能 cpu 内存 硬盘 资源
  20. 无需编码生成信息系统_无需编码即可逐步进行花分类

热门文章

  1. vue+echarts实现省份地图展示
  2. 学习笔记——数据库(过滤搜索2:正则表达式)
  3. linux下c网络编程实现串口与网口的信息透传_串口网口数据透传程序
  4. java行业2011寄语
  5. iOS Xcode如何添加模拟器
  6. FL Studio21电脑版免费音乐编曲宿主软件下载
  7. 卡丽来相片卡拉OK VCD制作系统破解版(大型)
  8. 2018.07.19 仿优酷网页小项目
  9. [转载]简介使用Java编写Palm OS程序的解决方案(1)
  10. 不能为虚拟电脑**打开一个新任务 VT-x is disabled in the BIOS for all CPU