RoI pooling层详解
RoI pooling层的意义:
RoIs pooling是pooling层的一种,而且是针对RoIs的pooling,特点是输入特征图的尺寸不固定,但是输出特征图的尺寸固定;
什么是ROI呢?
ROI是Region of Interest的简写,指的是在“特征图上的框”;
1)在Fast RCNN中, RoI是指Selective Search完成后得到的“候选框”在特征图上的映射,如下图所示;
2)在Faster RCNN中,候选框是经过RPN产生的,然后再把各个“候选框”映射到特征图上,得到RoIs。
输入有两部分组成:
- 特征图:指的是图1中所示的特征图,在Fast RCNN中,它位于RoI Pooling之前,在Faster RCNN中,它是与RPN共享那个特征图,通常我们常常称之为“share_conv”;
- rois:在Fast RCNN中,指的是Selective Search的输出;在Faster RCNN中指的是RPN的输出,一堆矩形候选框框,形状为1x5x1x1(4个坐标+索引index),其中值得注意的是:坐标的参考系不是针对feature map这张图的,而是针对原图的(神经网络最开始的输入)
输出:
- 输出是batch个vector,其中batch的值等于RoI的个数,vector的大小为channel * w * h;RoI Pooling的过程就是将一个个大小不同的box矩形框,都映射成大小固定(w * h)的矩形框;
ROI pooling具体操作如下:
- 根据输入image,将proposals映射到feature map上ROIs对应位置;
- 将映射后的区域划分为相同大小的sections(sections数量与输出的维度相同);
- 对每个section进行max pooling
ROI pooling example
考虑一个8*8大小的feature map,一个ROI,以及输出大小为2*2.
(1)输入的固定大小的feature map
(2)region proposal 投影之后位置(左上角,右下角坐标):(0,3),(7,8)。
(3)将其划分为(2*2)个sections(因为输出大小为2*2),我们可以得到:
(4)对每个section做max pooling,可以得到:
参考:https://blog.csdn.net/auto1993/article/details/78514071
https://blog.csdn.net/a8039974/article/details/80811699
RoI pooling层详解相关推荐
- 目标检测特殊层:ROI Align层详解
ROI Align 是在Mask-RCNN这篇论文里提出的一种区域特征聚集方式, 很好地解决了ROI Pooling操作中两次量化造成的区域不匹配(mis-alignment)的问题.实验显示,在检测 ...
- caffe网络模型各层详解(中文版)
caffe网络模型各层详解(中文版) 参考网址:https://blog.csdn.net/qq_34220460/article/details/79872830 一.数据层及参数 要运行caffe ...
- ROI Pooling层解析
ROI Pooling的意义 ROIs Pooling顾名思义,是Pooling层的一种,而且是针对RoIs的Pooling,他的特点是输入特征图尺寸不固定,但是输出特征图尺寸固定: 什么是ROI呢? ...
- [4G5G专题-57]:L2 RLC层-详解RLC架构、数据封装、三种模式:透明TM、非确认模式UM、确认模式AM
目录 第1章 L2 RLC层的架构 1.1 RAN的架构 1.2 L2架构概述 1.3 RLC软件系统结构图 第2章 TCP/IP协议提供的三种传输服务 2.1 TCP 2.2 UDP 2.3 R ...
- torch.nn模块之池化层详解
torch中的池化层 1. torch.nn模块中的池化层简介 2. 池化的调用方式 3. 图像池化演示 3.1 最大值池化 3.2 平均值池化 3.3 自适应平均值池化 参考资料 1. torch. ...
- Faster-RCNN(一)之ROI Pooling层
Faster-RCNN可看作是在Fast-RCNN的基础上,加了RPN层.其网络结构如下图所示(图片源于网络 https://www.cnblogs.com/zyly/p/9247863.html): ...
- 双线性池化(Bilinear Pooling)详解、改进及应用
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|深度学习这件小事 最近看了一系列bilinear pool ...
- 网络基础知识-TCP/IP协议各层详解
TCP/IP简介 虽然大家现在对互联网很熟悉,但是计算机网络的出现比互联网要早很多. 计算机为了联网,就必须规定通信协议,早期的计算机网络,都是由各厂商自己规定一套协议,IBM.Apple和Micro ...
- [pytorch]yolov3.cfg参数详解(每层输出及route、yolo、shortcut层详解)
文章目录 Backbone(Darknet53) 第一次下采样(to 208) 第二次下采样(to 104) 第三次下采样(to 52) 第四次下采样(to 26) 第五次下采样(to 13) YOL ...
最新文章
- 【自用】 Android Studio Gradle sync failed
- CGLIB代理到底是个什么东西?这是一篇最全的CGLIB大全
- linux 批量同步,多主机目录到备份服务器批量同步脚本
- discuz viewthread.php,修改discuz论坛的标题header和footer
- LeetCode 109. 有序链表转换二叉搜索树(快慢指针+递归)
- Thread多线程用法示例
- 三、optimizer_trace分析
- 2020美赛MCM/ICM参赛及获奖分析
- 湖南省工业技师学院计算机证,湖南省工业技师学院
- 推荐系统笔记(二):常用数据集Movielens学习
- 申请计算机助理的英语作文,助理面试英文自我介绍范文(通用5篇)
- 什么杀毒软件最好|什么杀毒软件好用
- 《系统与网络管理实践》(第三版)作者访谈
- 怎么查询oracle归档模式,查看oracle数据库归档模式
- 批量部署服务器系统,自动化运维之cobbler批量部署服务器系统 | opengers
- NISP证书换取CISP证书需要哪些条件?
- 应用内打开QQ,发送消息给指定联系人(临时会话),应用内加群
- 什么是JPA?Java持续性介绍
- linux 如何安装maven
- WebSocket断开原因
热门文章
- Linux必须学内容
- 三相电机故障排除(超详解)
- 【Linux 内核 内存管理】分区伙伴分配器 ⑦ ( z->watermark[WMARK_MIN] 最低水位计算 | min_free_kbytes 初始化 )
- 像风尘女一样陪酒:女生报社第一天
- 【ubuntu】build-essential -y
- 2021年11月27日 DAY1
- 原来吴京拍的“巨齿鲨”不是传说,在马里亚纳?
- Unity3D--击毙怪物文本提示及其带声音(文本渐隐渐现)
- 如何向公众号添加的QQ链接(已解决)
- MSM381A3729H9HP-C