阅读笔记:Instance-aware semantic segmentation via Multi-task Network Cascades
论文阅读:Instance-aware semantic segmentation via Multi-task Network Cascades
论文信息:CVPR2016, PASCAL VOC in VGG 63.5% mAP. COCO2015 in resnet101 won first prize
整体框架:对于传统的多任务方法,都是在共享特征的基础上,每个任务同时进行各不干扰,互相独立。这篇文章是在共享特征的基础上,上一个任务依赖于下一个任务,如此形成级联式的多任务结构(Multi-task Network Cascade,MNC)。
三个任务:(1)Differentiating instances;(2)Estimating masks;(3)Categorizing objects;
使用VGG16的第13层卷积层特征作为共享特征。每个阶段包含一个loss,下一阶段的loss依赖于前一阶段loss,故三个阶段的loss都不是独立的。
任务一:differentiating instance-->regressing box-level instances ,该阶段的主要任务找出所有可能的物体框,即使用Faster RCNN中的RPN网络,使用NMS得到 top-ranked 300个box;
这一阶段的主要实现就是在共享特征的基础上附加一个3*3的卷积层用于降维以及1*1的卷积用于目标框定位和目标分类。因此在这一阶段的loss,作者直接使用的是RPN的loss,即:
任务二:estimating masks-->regressing mask-level instances,该阶段的主要任务是以共享特征和上一阶段的得到的bounding box作为输入,输出基于box的pixel-level 的mask,不过此时的mask是class-agnostic,即无法对mask进行类别区分。
这一阶段的主要实现是在task1 输出的不同大小的box上使用ROI warping Pooling产生固定大小的特征:14*14大小的feature map,在此基础上为每个box附加两个fc层:fc1(256)+fc2(m*m,28*28),这里的28*28是预先设定的mask的分辨率。因此这一阶段的task不仅是依赖于mask还依赖于box,所以这一阶段的loss,即:
任务三:categorizing objects-->categorizing instances,该阶段的主要任务是以共享特征,task1的box,task2的mask作为输入,输出每个instance的categories scores。
这一阶段的主要实现是,一方面,在ROI warping pooling 的基础上连接两个fc层:fc1(4096)+fc2(4096);另一方面对task2得到的mask 也连接两个fc层:fc1(4096)+fc2(4096);然后再对这两个通道进行concat,最后得到每个instance的得分。因此这一阶段的计算量比较大,也是导致整个MNC模型巨大的原因。这一阶段的loss,如下:
End-to-end training
整个MNC网络结构的loss function如下:
MNC主要的技术挑战就是对上面的loss function 如何可以应用链式法则进行反向传播,实现end-to-end training。在fast R-CNN论文中使用的RoI pooling 的预测框是经过预训练的,是固定的,它的反向传播只考虑F(Θ) ,但我们现在必须同时考虑Bi(Θ),而在这里得到的预测框确实在不断变化。但是,实际上task2中的框是由task1给出的,那么task2的loss就不只是依赖mask,还依赖框。这导致了无法对这部分以end to end的方式来训练,因为无法同时对这两部分求导。
为了解决上述问题,作者把ROI pooling分为了两部分:ROI warping 与 pooling。ROI warping的具体实现可以看原文。
阅读笔记:Instance-aware semantic segmentation via Multi-task Network Cascades相关推荐
- JSNet: Joint Instance and Semantic Segmentation of 3D Point Clouds
Abstract 在本文中,我们提出了一种新的联合实例和语义分割方法,称为JSNet,以同时解决3D点云的实例和语义分割.首先,我们建立了一个有效的骨干网络来从原始点云中提取鲁棒的特征.其次,为了获得 ...
- ECCV2020语义分割——Self-Prediction for Joint Instance and Semantic Segmentation of Point Clouds
Self-Prediction for Joint Instance and Semantic Segmentation of Point Clouds Abstract (一) Introducti ...
- 语义分割--Large Kernel Matters--Improve Semantic Segmentation by Global Convolutional Network
Large Kernel Matters–Improve Semantic Segmentation by Global Convolutional Network https://arxiv.org ...
- Robust semantic segmentation by dense fusion network on blurred vhr remote sensing images
Robust semantic segmentation by dense fusion network on blurred vhr remote sensing images 说明se的设计还是很 ...
- 论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering,SENet,用于大规模子空间聚类的自表达网络
论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering. SENet--用于大规模子空间聚类的自表达网络 前言 摘要 ...
- Semi-supervised Semantic Segmentation with Error Localization Network(基于误差定位网络的半监督语义分割 )
Semi-supervised Semantic Segmentation with Error Localization Network(基于误差定位网络的半监督语义分割 ) Abstract 本文 ...
- 【论文笔记】Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspectivewith Transformers
声明 不定期更新自己精度论文,通俗易懂,初级小白也可以理解 涉及范围:深度学习方向,包括 CV.NLP.Data Fusion.Digital Twin 论文题目: Rethinking Semant ...
- 论文笔记:Integrating Semantic Segmentation and Retinex Model for Low Light Image Enhancement
来源:Proceedings of the 28th ACM International Conference on Multimedia (2020) 目录 Contributions Mothol ...
- 论文笔记-SSF-DAN: Separated Semantic Feature based Domain Adaptation Network for Semantic Segmentation
论文信息 论文标题:SSF-DAN: Separated Semantic Feature based Domain Adaptation Network for Semantic Segmentat ...
最新文章
- SAP WM 针对采购订单收货时候不能自动获取物料主数据里的Special Movement Indicator?
- 【深度学习】图像自动处理工具SimpleITK的使用(Python)
- unix,linux,windows 哪个更好,更适合做服务器
- React篇-报错信息:warning: Can't call setState (or forceUpdate) on an unmounted component.
- LeetCode:汇总区间【228】
- 【排错】net::ERR_ABORTED 404
- oracle constraint_type 问题
- 实际电压/流源模型及其等效分析
- osgEarth用户手册
- Js——event详解
- sdut 数据结构实验之二叉树六:哈夫曼编码
- linux手动生成dump文件权限不足_linux下生成dump文件方法及设置
- 23个实用 Javascript Tab导航插件
- 什么标签用于在表单中构建复选框_基础表单标签及属性
- Linux多线程工作笔记0004---C语言中g++ -o -c -g 功能
- json.parser性能_Jackson JSON Java Parser API示例教程
- 读书:海明威的《老人与海》
- php session 设置无效
- Atitit 艾提拉总结的操作硬件解决方案 目录 1.1. Atitit 列出wifi热点以及连接	1 1.2. 剪贴板	1 1.3. 屏幕 触摸与截屏	1 1.4. 性能 cpu 内存 硬盘 资源
- 无需编码生成信息系统_无需编码即可逐步进行花分类
热门文章
- vue+echarts实现省份地图展示
- 学习笔记——数据库(过滤搜索2:正则表达式)
- linux下c网络编程实现串口与网口的信息透传_串口网口数据透传程序
- java行业2011寄语
- iOS Xcode如何添加模拟器
- FL Studio21电脑版免费音乐编曲宿主软件下载
- 卡丽来相片卡拉OK VCD制作系统破解版(大型)
- 2018.07.19 仿优酷网页小项目
- [转载]简介使用Java编写Palm OS程序的解决方案(1)
- 不能为虚拟电脑**打开一个新任务 VT-x is disabled in the BIOS for all CPU