RoI pooling层的意义:

RoIs pooling是pooling层的一种,而且是针对RoIs的pooling,特点是输入特征图的尺寸不固定,但是输出特征图的尺寸固定;

什么是ROI呢?
ROI是Region of Interest的简写,指的是在“特征图上的框”;
1)在Fast RCNN中, RoI是指Selective Search完成后得到的“候选框”在特征图上的映射,如下图所示;
2)在Faster RCNN中,候选框是经过RPN产生的,然后再把各个“候选框”映射到特征图上,得到RoIs。

输入有两部分组成:

  • 特征图:指的是图1中所示的特征图,在Fast RCNN中,它位于RoI Pooling之前,在Faster RCNN中,它是与RPN共享那个特征图,通常我们常常称之为“share_conv”;
  • rois:在Fast RCNN中,指的是Selective Search的输出;在Faster RCNN中指的是RPN的输出,一堆矩形候选框框,形状为1x5x1x1(4个坐标+索引index),其中值得注意的是:坐标的参考系不是针对feature map这张图的,而是针对原图的(神经网络最开始的输入)

输出:

  • 输出是batch个vector,其中batch的值等于RoI的个数,vector的大小为channel * w * h;RoI Pooling的过程就是将一个个大小不同的box矩形框,都映射成大小固定(w * h)的矩形框;

ROI pooling具体操作如下:

  • 根据输入image,将proposals映射到feature map上ROIs对应位置;
  • 将映射后的区域划分为相同大小的sections(sections数量与输出的维度相同);
  • 对每个section进行max pooling

ROI pooling example

考虑一个8*8大小的feature map,一个ROI,以及输出大小为2*2.

(1)输入的固定大小的feature map 

(2)region proposal 投影之后位置(左上角,右下角坐标):(0,3),(7,8)。

(3)将其划分为(2*2)个sections(因为输出大小为2*2),我们可以得到:

(4)对每个section做max pooling,可以得到:

参考:https://blog.csdn.net/auto1993/article/details/78514071

https://blog.csdn.net/a8039974/article/details/80811699

RoI pooling层详解相关推荐

  1. 目标检测特殊层:ROI Align层详解

    ROI Align 是在Mask-RCNN这篇论文里提出的一种区域特征聚集方式, 很好地解决了ROI Pooling操作中两次量化造成的区域不匹配(mis-alignment)的问题.实验显示,在检测 ...

  2. caffe网络模型各层详解(中文版)

    caffe网络模型各层详解(中文版) 参考网址:https://blog.csdn.net/qq_34220460/article/details/79872830 一.数据层及参数 要运行caffe ...

  3. ROI Pooling层解析

    ROI Pooling的意义 ROIs Pooling顾名思义,是Pooling层的一种,而且是针对RoIs的Pooling,他的特点是输入特征图尺寸不固定,但是输出特征图尺寸固定: 什么是ROI呢? ...

  4. [4G5G专题-57]:L2 RLC层-详解RLC架构、数据封装、三种模式:透明TM、非确认模式UM、确认模式AM

    目录 第1章  L2 RLC层的架构 1.1 RAN的架构 1.2 L2架构概述 1.3 RLC软件系统结构图 第2章 TCP/IP协议提供的三种传输服务 ​2.1 TCP 2.2 UDP 2.3 R ...

  5. torch.nn模块之池化层详解

    torch中的池化层 1. torch.nn模块中的池化层简介 2. 池化的调用方式 3. 图像池化演示 3.1 最大值池化 3.2 平均值池化 3.3 自适应平均值池化 参考资料 1. torch. ...

  6. Faster-RCNN(一)之ROI Pooling层

    Faster-RCNN可看作是在Fast-RCNN的基础上,加了RPN层.其网络结构如下图所示(图片源于网络 https://www.cnblogs.com/zyly/p/9247863.html): ...

  7. 双线性池化(Bilinear Pooling)详解、改进及应用

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|深度学习这件小事 最近看了一系列bilinear pool ...

  8. 网络基础知识-TCP/IP协议各层详解

    TCP/IP简介 虽然大家现在对互联网很熟悉,但是计算机网络的出现比互联网要早很多. 计算机为了联网,就必须规定通信协议,早期的计算机网络,都是由各厂商自己规定一套协议,IBM.Apple和Micro ...

  9. [pytorch]yolov3.cfg参数详解(每层输出及route、yolo、shortcut层详解)

    文章目录 Backbone(Darknet53) 第一次下采样(to 208) 第二次下采样(to 104) 第三次下采样(to 52) 第四次下采样(to 26) 第五次下采样(to 13) YOL ...

最新文章

  1. 【自用】 Android Studio Gradle sync failed
  2. CGLIB代理到底是个什么东西?这是一篇最全的CGLIB大全
  3. linux 批量同步,多主机目录到备份服务器批量同步脚本
  4. discuz viewthread.php,修改discuz论坛的标题header和footer
  5. LeetCode 109. 有序链表转换二叉搜索树(快慢指针+递归)
  6. Thread多线程用法示例
  7. 三、optimizer_trace分析
  8. 2020美赛MCM/ICM参赛及获奖分析
  9. 湖南省工业技师学院计算机证,湖南省工业技师学院
  10. 推荐系统笔记(二):常用数据集Movielens学习
  11. 申请计算机助理的英语作文,助理面试英文自我介绍范文(通用5篇)
  12. 什么杀毒软件最好|什么杀毒软件好用
  13. 《系统与网络管理实践》(第三版)作者访谈
  14. 怎么查询oracle归档模式,查看oracle数据库归档模式
  15. 批量部署服务器系统,自动化运维之cobbler批量部署服务器系统 | opengers
  16. NISP证书换取CISP证书需要哪些条件?
  17. 应用内打开QQ,发送消息给指定联系人(临时会话),应用内加群
  18. 什么是JPA?Java持续性介绍
  19. linux 如何安装maven
  20. WebSocket断开原因

热门文章

  1. Linux必须学内容
  2. 三相电机故障排除(超详解)
  3. 【Linux 内核 内存管理】分区伙伴分配器 ⑦ ( z->watermark[WMARK_MIN] 最低水位计算 | min_free_kbytes 初始化 )
  4. 像风尘女一样陪酒:女生报社第一天
  5. 【ubuntu】build-essential -y
  6. 2021年11月27日 DAY1
  7. 原来吴京拍的“巨齿鲨”不是传说,在马里亚纳?
  8. Unity3D--击毙怪物文本提示及其带声音(文本渐隐渐现)
  9. 如何向公众号添加的QQ链接(已解决)
  10. MSM381A3729H9HP-C