没有spp的网络的缺点

1,现有的dcnn需要固定尺寸的图片作为输入,这样对图片的宽高比和尺寸大小作出了限制。
2,如果图片尺寸是任意的,在输入之前需要做裁剪或图像扭曲(crop or warp(resize))来适应网络的固定尺寸输入。剪切后的图片可能不能包含整个物体。扭曲后的内容可能会导致几何变形。识别准确率会因为物体内容缺失或变形而减低。

使用spp的好处

1,spp能生成一个固定长度的输出,不管输入图片大小是否相同。
2,spp使用多级spatial bins,而sliding window pooling只使用单一window size,实验证明前者对物体形变更鲁棒。
3,spp能对由不同尺寸的输入提取的feature进行池化。

用不同尺寸图片进行训练能增强scale-invariance和减少过拟合

spp放在哪里

最后一层池化层用spp代替

spp长什么样

例子:
feature map: a*a 13*13 any
bin: n*n 3*3 人为固定
window size: a/n(上取整) 5 由any和固定决定
stride:a/n(下取整) 4 由any和固定决定
spp的输出是k/*M维的向量,k是最后conv层的filter数,M是bin的数目。spp输出的固定维度向量作为input输入到全连接层。

Ref

Spatial Pyramid Pooling in Deep Convolutional
Networks for Visual Recognition Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun

spatial pyramid pooling(spp)相关推荐

  1. 语义分割——Spatial Pyramid Pooling (SPP)的作用

    1 前言 我们在DeepLabV3+中学习到了ASPP算法,ASPP就是使用了膨胀卷积的Spatial Pyramid Pooling (SPP)- 2 SPP的作用 --多尺度特征融合: --将不同 ...

  2. 空间金字塔池化(Spatial Pyramid Pooling, SPP)原理和代码实现(Pytorch)

    想直接看公式的可跳至第三节 3.公式修正 一.为什么需要SPP 首先需要知道为什么会需要SPP. 我们都知道卷积神经网络(CNN)由卷积层和全连接层组成,其中卷积层对于输入数据的大小并没有要求,唯一对 ...

  3. SPP(Spatial Pyramid Pooling)解读

    1.为什么会出现SPP结构,其作用是什么? 通过Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognitio ...

  4. SPP: Spatial Pyramid Pooling

    paper:  Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition code:   https: ...

  5. Spatial Pyramid Pooling(SPP)原理简介

    b站这个Up主讲的挺好,就是莫名其妙搞个背景音乐怪怪的...视频讲解 Spatial Pyramid Pooling(SPP)中文叫空间金字塔池化 SPP目的:这个原理要解决的是传统CNN网络对输入图 ...

  6. SPP(spatial pyramid pooling) 空间金字塔池化

    (1)SPP层能达到什么样的效果? 由于全连接层对数据大小的输入是由要求的,比如要求是256*1才能输入到全连接层里面,那你288*1的特称图就不能输入到全连接层了. SPP层能达到的效果是:不管你的 ...

  7. SPP(Spatial Pyramid Pooling)

    Spatial Pyramid Pooling(空间金字塔池化) 在一般的CNN结构中,在卷积层后面通常连接着全连接.而全连接层的特征数是固定的,所以在网络输入的时候,会固定输入的大小(fixed-s ...

  8. c语言spp,SPP(Spatial Pyramid Pooling)详解

    一直对Fast RCNN中ROI Pooling层不解,不同大小的窗口输入怎么样才能得到同样大小的窗口输出呢,今天看到一篇博文讲得挺好的,摘录一下,方便查找. Introduction 在一般的CNN ...

  9. Spatial Pyramid Pooling(空间金字塔池化)-变尺度CNN训练

    1. 需求创造好的产品,产品拓宽原始的需求 当前的深度神经网络一般都需要固定的输入图像尺寸(如224*224). 这种需求很明显是人为的,潜在性的弊端会降低识别精度(为了使图像尺寸相同,一定会涉及到图 ...

最新文章

  1. 也许,这是东半球最叼的Java内存模型
  2. c语言的特点能够编制出复杂的功能程序,以下不是C语言的特点的是()
  3. 机器人能否取代人工?阿迪达斯付出血的教训,含泪关闭智能工厂
  4. a+=b不一定等于a=a+b
  5. 一款纯css3实现的超炫动画背画特效
  6. MyBatis : Mapper 接口以及 Example 使用实例、详解
  7. android web通讯录,Android手机开发之通讯录
  8. Balanced Lineup(POJ-3264)
  9. vue瀑布流demo_面试加分企业级Vue瀑布流
  10. mybatis + spring boot + yml 配置,告别XML
  11. Android 系统(65)---Android修改分区格式为F2FS
  12. 小妙招:如何防止你的 jar 包被反编译?
  13. 解决fiexd和transform一起用导致的失效问题
  14. c语言单片机仿真keil,如何在keil中仿真stm32单片机
  15. 搭建个人网站没有公网IP地址可以吗?
  16. html 背景不填充,CSS之背景的填充范围
  17. 2020机修钳工(中级)考试及机修钳工(中级)复审模拟考试
  18. 学习amber教程A17:伞形采样,绘制丙氨酸三肽的势能面
  19. fing网络扫描仪android,Fing网络扫描仪
  20. FEM基函数:从理论推导到matlab实现形式

热门文章

  1. uni-app获取Storage中的数据以及将数据赋值给变量
  2. setTimeout()用法
  3. 2012网易校园招聘杭州站笔试
  4. matlab上确界距离,常见距离公式的MATLAB代码(一)
  5. ubuntu22.04安装wechat微信
  6. Android 图片获取显示照片拍摄时间
  7. 计算机用户变量path的初值,环境变量path默认值怎么还原
  8. Java 工程师核心基础修炼
  9. No qualifying bean of type ‘XXX‘ available
  10. 第4篇:jsp型webshell被删情况下如何溯源攻击时间