spatial pyramid pooling(spp)
没有spp的网络的缺点
1,现有的dcnn需要固定尺寸的图片作为输入,这样对图片的宽高比和尺寸大小作出了限制。
2,如果图片尺寸是任意的,在输入之前需要做裁剪或图像扭曲(crop or warp(resize))来适应网络的固定尺寸输入。剪切后的图片可能不能包含整个物体。扭曲后的内容可能会导致几何变形。识别准确率会因为物体内容缺失或变形而减低。
使用spp的好处
1,spp能生成一个固定长度的输出,不管输入图片大小是否相同。
2,spp使用多级spatial bins,而sliding window pooling只使用单一window size,实验证明前者对物体形变更鲁棒。
3,spp能对由不同尺寸的输入提取的feature进行池化。
用不同尺寸图片进行训练能增强scale-invariance和减少过拟合
spp放在哪里
最后一层池化层用spp代替
spp长什么样
例子:
feature map: a*a 13*13 any
bin: n*n 3*3 人为固定
window size: a/n(上取整) 5 由any和固定决定
stride:a/n(下取整) 4 由any和固定决定
spp的输出是k/*M维的向量,k是最后conv层的filter数,M是bin的数目。spp输出的固定维度向量作为input输入到全连接层。
Ref
Spatial Pyramid Pooling in Deep Convolutional
Networks for Visual Recognition Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun
spatial pyramid pooling(spp)相关推荐
- 语义分割——Spatial Pyramid Pooling (SPP)的作用
1 前言 我们在DeepLabV3+中学习到了ASPP算法,ASPP就是使用了膨胀卷积的Spatial Pyramid Pooling (SPP)- 2 SPP的作用 --多尺度特征融合: --将不同 ...
- 空间金字塔池化(Spatial Pyramid Pooling, SPP)原理和代码实现(Pytorch)
想直接看公式的可跳至第三节 3.公式修正 一.为什么需要SPP 首先需要知道为什么会需要SPP. 我们都知道卷积神经网络(CNN)由卷积层和全连接层组成,其中卷积层对于输入数据的大小并没有要求,唯一对 ...
- SPP(Spatial Pyramid Pooling)解读
1.为什么会出现SPP结构,其作用是什么? 通过Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognitio ...
- SPP: Spatial Pyramid Pooling
paper: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition code: https: ...
- Spatial Pyramid Pooling(SPP)原理简介
b站这个Up主讲的挺好,就是莫名其妙搞个背景音乐怪怪的...视频讲解 Spatial Pyramid Pooling(SPP)中文叫空间金字塔池化 SPP目的:这个原理要解决的是传统CNN网络对输入图 ...
- SPP(spatial pyramid pooling) 空间金字塔池化
(1)SPP层能达到什么样的效果? 由于全连接层对数据大小的输入是由要求的,比如要求是256*1才能输入到全连接层里面,那你288*1的特称图就不能输入到全连接层了. SPP层能达到的效果是:不管你的 ...
- SPP(Spatial Pyramid Pooling)
Spatial Pyramid Pooling(空间金字塔池化) 在一般的CNN结构中,在卷积层后面通常连接着全连接.而全连接层的特征数是固定的,所以在网络输入的时候,会固定输入的大小(fixed-s ...
- c语言spp,SPP(Spatial Pyramid Pooling)详解
一直对Fast RCNN中ROI Pooling层不解,不同大小的窗口输入怎么样才能得到同样大小的窗口输出呢,今天看到一篇博文讲得挺好的,摘录一下,方便查找. Introduction 在一般的CNN ...
- Spatial Pyramid Pooling(空间金字塔池化)-变尺度CNN训练
1. 需求创造好的产品,产品拓宽原始的需求 当前的深度神经网络一般都需要固定的输入图像尺寸(如224*224). 这种需求很明显是人为的,潜在性的弊端会降低识别精度(为了使图像尺寸相同,一定会涉及到图 ...
最新文章
- 也许,这是东半球最叼的Java内存模型
- c语言的特点能够编制出复杂的功能程序,以下不是C语言的特点的是()
- 机器人能否取代人工?阿迪达斯付出血的教训,含泪关闭智能工厂
- a+=b不一定等于a=a+b
- 一款纯css3实现的超炫动画背画特效
- MyBatis : Mapper 接口以及 Example 使用实例、详解
- android web通讯录,Android手机开发之通讯录
- Balanced Lineup(POJ-3264)
- vue瀑布流demo_面试加分企业级Vue瀑布流
- mybatis + spring boot + yml 配置,告别XML
- Android 系统(65)---Android修改分区格式为F2FS
- 小妙招:如何防止你的 jar 包被反编译?
- 解决fiexd和transform一起用导致的失效问题
- c语言单片机仿真keil,如何在keil中仿真stm32单片机
- 搭建个人网站没有公网IP地址可以吗?
- html 背景不填充,CSS之背景的填充范围
- 2020机修钳工(中级)考试及机修钳工(中级)复审模拟考试
- 学习amber教程A17:伞形采样,绘制丙氨酸三肽的势能面
- fing网络扫描仪android,Fing网络扫描仪
- FEM基函数:从理论推导到matlab实现形式
热门文章
- uni-app获取Storage中的数据以及将数据赋值给变量
- setTimeout()用法
- 2012网易校园招聘杭州站笔试
- matlab上确界距离,常见距离公式的MATLAB代码(一)
- ubuntu22.04安装wechat微信
- Android 图片获取显示照片拍摄时间
- 计算机用户变量path的初值,环境变量path默认值怎么还原
- Java 工程师核心基础修炼
- No qualifying bean of type ‘XXX‘ available
- 第4篇:jsp型webshell被删情况下如何溯源攻击时间