卷积网络中的感受野

1.感受野(Receptive field (RF))是什么?

在卷积神经网络中,感受野的定义是 卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。

大家知道现在CNN深度学习越来越深
为了压缩计算量越到后面的层数往往feature size越来越小
但参与“决策”往往是最后几层网络(当然有FPN等神迹)
因此
如何保证小的网络仍然具有全局性是构建CNN网络的一个重要依据
RF便是一个考量feature map中每个神经元具有多少全局性的指标。

2.CNN中感受野的计算

从直观上讲,感受野就是视觉感受区域的大小。在卷积神经网络中,感受野的定义是决定某一层输出结果中一个元素所对应的输入层的区域大小。

感受野计算时有下面的几个情况需要说明:

  • a)第一层卷积层的输出特征图像素的感受野的大小等于滤波器的大小;
  • b)深层卷积层的感受野大小和它之前所有层的滤波器大小和步长有关系;
  • c)计算感受野大小时,忽略了图像边缘的影响,即不考虑padding的大小。

至于如何计算感受野,我的建议是top to down的方式,即从网络的最后向前推,感受野的大小是由kernel size(filter)和stride size(步长)一起决定的,公式: rfsize = f(out, stride, ksize) = (out - 1) * stride + ksize,其中out是指上一层感受野的大小,stride是当前层stride,最后一层不带入公式,它的ksize是前一层的out。
理解:
Feature Map的尺寸=(input_size + 2 * padding_size − ksize)/stride+1
根据定义 感受野是决定某一层输出结果中一个元素所对应的输入层的区域大小
这里指的是要求解的那层的一个元素也就是最初输入的out=1:
rfsize = f(out, stride, ksize) = (out - 1) * stride + ksize
感受野近似于用feature map反推input_size ,只是不考虑padding。

例1:
以VGG16为例:
一个元素,所以out=1
pool2: rfsize= (1-1)*2+2=2
conv1_2: rfsize=(2-1)*1+3=4
conv1_1: rfsize= (4-1)*1+3=6

例2:
r指感受野 s:stride,p:padding,k:filter

layer1对layer0:
out=1
(1-1)*2+3=3

layer2对layer0:
out=1
(1-1)*2+3=3
(3-1)*2+3=7

3. 计算Receptive field size的小程序

FOMORO AI:https://fomoro.com/research/article/receptive-field-calculator

4.参考:
https://www.cnblogs.com/34fj/p/9139756.html
https://www.zhihu.com/question/66954030/answer/715416325
https://blog.csdn.net/weixin_43951539/article/details/100759414
https://fomoro.com/research/article/receptive-field-calculator#3,2,1,SAME;3,1,1,SAME

人体姿态估计——感受野相关推荐

  1. 基于深度学习和传统算法的人体姿态估计,技术细节都讲清楚了

    作者 | 站长 pursueYfuture 来源 | AI专栏(ID: pursue-Y-future) 计算机视觉的一大研究热点是人体姿态估计,还有很多问题急需解决,比如遮挡,交互等等.在最近的CV ...

  2. 3D 人体姿态估计简述

    0 前言 3D Human Pose Estimation(以下简称 3D HPE )的目标是在三维空间中估计人体关键点的位置.3D HPE 的应用非常广泛,包括人机交互.运动分析.康复训练等,它也可 ...

  3. Lifting Transformer: 基于跨步卷积Transformer的高效三维人体姿态估计

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 论文:Lifting Transformer for 3D Human Pose Estimation ...

  4. PoseFormer:首个纯基于Transformer的 3D 人体姿态估计网络,性能达到 SOTA

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 本文分享一篇 52CV 粉丝的论文『3D Human Pose Estimation with Spa ...

  5. Human Pose Estimation人体姿态估计综述调研

    给定一幅图像或一段视频,人体姿态估计就是去恢复其中人体关节点位置的过程. 数据集 LSP 地址:http://sam.johnson.io/research/lsp.htm 样本数:2K 关节点个数: ...

  6. 【人体姿态估计1】Convolutional Pose Machines_2016

    文章目录 1. Introduction 2. 网络结构简介 3. Method 3.1 Pose Machines 3.2 Convolutional Pose Machines -- CPMs 3 ...

  7. P4 2019年人体姿态估计指引

    2019年人体姿态估计指引 本文是介绍2D人体姿势估计的,作者先简单的介绍了下Human Pose Estimation,然后简要的说了下Human Pose Estimation的发展,之后,列出了 ...

  8. 实录 | 旷视研究院详解COCO2017人体姿态估计冠军论文(PPT+视频)

    主讲人:王志成 | 旷视研究院研究员 屈鑫 整理编辑 量子位 出品 | 公众号 QbitAI 12月13日晚,量子位·吃瓜社联合Face++论文解读系列第二期开讲,本期中旷视(Megvii)研究院解读 ...

  9. 3D人体姿态估计论文汇总(CVPR/ECCV/ACCV/AAAI)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者:Vegetabird | 来源:知乎 https://zhuanlan.zhihu.com/p/ ...

最新文章

  1. PowerDesigner 常用设置
  2. [第11天]mySQL简单介绍
  3. python3 UDP TCP 调试回射命令行
  4. c语言字符串化简,华为面试题:一元多项式的化简 C语言实现源码
  5. Keras-数据增广
  6. monkey的具体使用及详细说明
  7. 跟我一起学.NetCore之Asp.NetCore启动流程浅析
  8. vscode连接远程服务器 SSH
  9. (30)Verilog HDL系统函数:$stop
  10. 站长必知的八大社会心理学效应
  11. 高仿QQ顶部控件之IOS SegmentView
  12. 有放回采样和无放回采样
  13. 【Xposed】框架安装full.xml.gz下载失败解决方法总结
  14. java基础下载音乐_抖音上超好听的神曲音乐,Python教你一次性下载
  15. 2021年9月国产数据库大事记-墨天轮
  16. JZOJ3987. Tree
  17. 人类简史-读书笔记之历史演变图
  18. Windows程序设计-剪贴板
  19. 免杀技术有一套(免杀方法大集结)(Anti-AntiVirus)
  20. TrueNorth: Design and Tool Flow of a 65 mW 1 Million Neuron Programmable Neurosynaptic Chip

热门文章

  1. 【实验】实验一 MATLAB环境与运算基础20211008
  2. Android 获取当前时间
  3. 模拟CMOS集成电路设计入门学习(12)
  4. VSCode+Astyle自动格式化代码教程(windows+linux)
  5. 基于thinkphp6开发的多微信管理系统CMS源码,带一键CURD等功能
  6. 《勋伯格和声学》读书笔记(四):小调调式,小调自然音三和弦及其转位
  7. 调调Eclipse3.5
  8. Java 简单控制台项目之客户信息管理软件 --- 凌宸1642
  9. 基于ssm作业管理系统
  10. Html合并单元格的使用