转自:https://blog.csdn.net/gaotihong/article/details/82982766

SE-attention

一、SE-NET


图1.SE-block
图1.中的Ftr是传统的卷积结构,X和U是Ftr的输入(C’xH’xW’)和输出(CxHxW),这些都是以往结构中已存在的。SENet增加的部分是U后的结构:对U先做一个Global Average Pooling(图中的Fsq(.),作者称为Squeeze过程),输出的1x1xC数据再经过两级全连接(图中的Fex(.),作者称为Excitation过程),最后用sigmoid(论文中的self-gating mechanism)限制到[0,1]的范围,把这个值作为scale乘到U的C个通道上, 作为下一级的输入数据。这种结构的原理是想通过控制scale的大小,把重要的特征增强,不重要的特征减弱,从而让提取的特征指向性更强。下面来看下SENet的一些细节:
(1)squeeze :GAP有很多算法,作者用了最简单的求平均的方法(公式1),将空间上所有点的信息都平均成了一个值。

(2)Excitation部分是用2个全连接来实现 ,第一个全连接把C个通道压缩成了C/r个通道来降低计算量(后面跟了RELU),第二个全连接再恢复回C个通道(后面跟了Sigmoid),r是指压缩的比例。作者尝试了r在各种取值下的性能 ,最后得出结论r=16时整体性能和计算量最平衡。

全连接层是为了利用通道间的相关性来训练出真正的scale。一次mini-batch个样本的squeeze输出并不代表通道真实要调整的scale值,真实的scale要基于全部数据集来训练得出,而不是基于单个batch,所以后面要加个全连接层来进行训练。

二、三种错误的SE结构


图2最上方的结构,squeeze的输出直接scale到输入上,没有了全连接层,某个通道的调整值完全基于单个通道GAP的结果,事实上只有GAP的分支是完全没有反向计算、没有训练的过程的,就无法基于全部数据集来训练得出通道增强、减弱的规律。

图2中间是经典的卷积结构,有人会说卷积训练出的权值就含有了scale的成分在里面,也利用了通道间的相关性,为啥还要多个SE Block?那是因为这种卷积有空间的成分在里面,为了排除空间上的干扰就得先用GAP压缩成一个点后再作卷积,压缩后因为没有了Height、Width的成分,这种卷积就是全连接了。

图2最下面的结构,SE模块和传统的卷积间采用并联而不是串联的方式,这时SE利用的是Ftr输入X的相关性来计算scale,X和U的相关性是不同的,把根据X的相关性计算出的scale应用到U上明显不合适。

三、SE-Inception和SE-ResNet结构


图3:SE-Inception和SE-ResNet结构

图3是两个SENet实际应用的例子,左侧是SE-Inception的结构,即Inception模块和SENet组和在一起;右侧是SE-ResNet,ResNet和SENet的组合,这种结构scale放到了直连相加之前。

四、总结

SENet把重要通道的特征强化,非重要通道的特征弱化,得到了很好的效果,这是一种全新的思路,在这个方向上将来可能会有更多的成果

SE-attention相关推荐

  1. 魔改Attention大集合

    ↑ 点击蓝字 关注视学算法 来源丨NewBeeNLP 编辑|极市平台 极市导读 如何对attention进行高效改进?本文盘点了相关论文,并梳理出它们的引用量.代码实现.算法复杂度和关键点,方便对比使 ...

  2. 注意力机制——Coordinate Attention

    目录 摘要 1 介绍 2 相关工作 2.1 Mobile Network 2.2 注意力机制 3 Coordinate Attention 3.1 Revisit SE Block 3.1.1 Squ ...

  3. 2021CVPR-Coordinate Attention for Efficient Mobile Network Design 坐标注意力机制

    前言 了解了SE和CBAM之后,Coordinate Attention(坐标注意)指出了前两者的一些缺点,并做出了一些改进,该篇论文发表于2021年CVPR Abstract 最近关于mobile ...

  4. 号称超过yolox和yolov5的PP-YoLoE

    PP-YoLoE | PP-YoLov2全面升级Anchor-Free,速度精度完美超越YoLoX和YoLov5 PP-YOLOE是基于PP-YOLOv2的卓越的单阶段Anchor-free模型,超越 ...

  5. CAMoE——屠榜 video retrieval challenge

    关注公众号,发现CV技术之美 作者:炎思提 原文:https://zhuanlan.zhihu.com/p/425226244 本文转自知乎,已获作者授权,请勿二次转载. ✎ 编 者 言  来自今年九 ...

  6. PySlowFast 平台的使用及解析——以X3D为例

    1.概述 PySlowFast 是Facebook近期开源的一个视频理解项目,其中包含了数个优秀论文的实现,包括SlowFast.X3D.I3D等.项目的地址在这里,本人最近正在做用该项目作视频行为识 ...

  7. 【FeatherNets】《FeatherNets:Convolutional Neural Networks as Light as Feather for Face Anti-spoofing》

    CVPR-2019 workshop code:https://github.com/SoftwareGift/FeatherNets_Face-Anti-spoofing-Attack-Detect ...

  8. 【CASIA-SURF】《A Dataset and Benchmark for Large-scale Multi-modal Face Anti-spoofing》

    CVPR-2019 ChaLearn Face Anti-spoofing Attack Detection Challenge@CVPR2019 比赛中采用了该数据集 结束比赛时的前三名如下: 1s ...

  9. CoordAttention解读

    简介 在轻量级网络上的研究表明,通道注意力会给模型带来比较显著的性能提升,但是通道注意力通常会忽略对生成空间选择性注意力图非常重要的位置信息.因此,新加坡国立大学的Qibin Hou等人提出了一种为轻 ...

  10. 百度网盘AI大赛-通用场景手写文字擦除亚军方案

    ★★★ 本文源自AlStudio社区精品项目,[点击此处]查看更多精品内容 >>> 通用手写文字擦除A榜2,B榜第3方案 一.赛题背景 随着技术发展,OCR扫描在学习.办公等众多场景 ...

最新文章

  1. 关于Verilog的可综合性
  2. 【转贴】PLSQL不安装客户端连接远程oracle
  3. Facebook:对比COPA 与CUBIC,BBR v1在拥塞控制及视频质量的表现
  4. Java并发编程艺术读书笔记
  5. 服务器2003 系统修复,第十一篇 Windows Server 2003系统修复.pdf
  6. linux ntp时间服务器配置
  7. 新松机器人产业小镇_机器人行业迎来拐点,新松机器人如何“过冬”?丨亿欧读财报...
  8. ios uiwindow弹窗_iOS-UIWindow详解
  9. 由H264软编码可以看出,电脑的性能远远超过手机
  10. jquery $.post 超时_详解如何实现前端jquery中的ajax方法,看这一篇就够了
  11. 深度置信网络python3实现
  12. Spatial Join学习
  13. 伊朗 2018 ICPC区域赛 A : Iranian ChamPions Cup
  14. Flutter BlendMode混合模式详解
  15. 现代密码学(六)——投币协议(Coin-Flipping by Phone)
  16. 创客学院9天C语言四
  17. 短视频ks(某手)高版本最新抓包方案,教你用hook大法绕过QUIC协议
  18. Google 和赛门铁克开撕!
  19. 908. Smallest Range I
  20. 为什么这么努力还这么贫穷?

热门文章

  1. 钉钉开发平台 —H5微应用-- 扫条形码、二维码 api 示例
  2. rosbag 数据分割
  3. idea本地项目部署到远程windows服务器
  4. Fastcopy介绍
  5. cmake 检测到cuda版本与实际版本不相符
  6. 2011计算机考研大,2011年计算机考研大纲
  7. oracle数据库的预定义的对象类型
  8. 多平台epub阅读器推荐
  9. Javadoc(文档注释)详解
  10. 基于Sip的P2P设计和原理分析