Asymmetric Non-local Neural Networks

论文:Asymmetric Non-local Neural Networks for Semantic Segmentation,ICCV,2019.

链接:paper

代码:github

本文是在Non-local Neural Networks(cvpr,2018) 这篇论文的基础上改进得来的,non-local block Non-local模块作为语义分割任务中很有用的技术,但因为计算量较大,需要较大的显存开销,这阻碍了non-local network在实际应用中的使用。本文提出了APNB来减少non-local block的计算量和显存开销,AFNB通过提升分割性能增强non-local block的学习能力。我们着重分析这篇论文的改进点。

Revisiting Non-local Block

输入

1.经过3个1x1的卷积Query,Key和Value变换之后,分别得到 :

2.计算所有空间位置特征向量的相似度:

3.归一化:

4.根据所有空间位置特征向量的相似度加权求和:

5.新特征经过1*1卷积变换后与原输入特征拼接:

计算复杂度:

Asymmetric Pyramid Non-local Block(APNB)

Non-local 的计算复杂度主要来自第2步和第4步:

可以看出经N(红色)改变为S,不会改变输出的size。

将N 减小到S ,相当于从θ 和 γ 采样一些特征点,代替使用HxW空间范围的点,如上图1(b)所示,增加两个sample模块Pθ和PγP_θ 和 P_γPθ​和Pγ​,采样一些稀疏的锚点,S就是锚点的数量。

1.经过3个1x1的卷积Query,Key和Value变换之后,分别得到

2.采样:,

3.计算所有空间位置与S个采样点的特征相似度:

4.归一化:

5.根据相似度加权求和:

5.新特征经过1X1卷积变换后与原输入特征拼接:

计算复杂度:

可以看出sample之后,S(110)<<N,则该模型就大大减少了计算复杂度和内存开销。

分割网络框架

由于作者将传统的non-local模型中的N经过Sample操作之后变成了较小的S,这样就不能捕捉到每个像素点之间的相关性信息,可能会造成效果不是很好,为了使模型性能进一步的提升,作者又在考虑长依赖性的情况下融合不同级别下的特征。

作者提出的非对称non-local网络的框架如下图所示:

首先作者采用ResNet - 101 网络作为模型的backbone,并且去掉了原模型中最后两个下采样层,使用空洞卷积来保持最后两个阶段得到的特征分辨率是原图像的1/8,作者将stage4和stage5的输出用AFNB模块进行融合,作者将Stage5得到的特征称为high-level 特征,将stage4得到的特征称为low-level特征,将这两个特征输入AFNB模块进行融合,其具体的过程如下图:

该模块将stage5产生的高级特征作为Query,将stage4得到的低级特征作为Key 和 Value,首先对Query,Key和Value 分别使用1x1 的卷积核进行降维,根据Asymmetric non-local 网络的特征需要进行Pyramid Pooling 操作,来对Key 和 Value 进行进一步的特征抽取,从而得到较小的特征表示。

APNB锚点采样策略

通过金字塔池化(何凯明在fast-rcnn 中提出的)对Key路径和Value路径得到的特征图进行下采样,得到

使用4中不同的池化操作:{1,3,6,8},然后将池化后的特征图展开成一维向量,拼接起来,一共得到 110 个锚点。经过Pyramid Pooling操作后原本CN大小的特征变成了大小为CS的特征矩阵,然后计算Query和Key的相关性矩阵计算,就是将Query转置后与Key相乘最终得到一个N*S的相关性矩阵,最后,将这个相关性矩阵与Value 特征进行转置相乘最终得到了不同leve下的特征融合表示OFO_FOF​,最后将这个表示与Stage5输出的特征拼接后得到原始图像最新的特征表示YFY_FYF​.

然后对得到的最新的特征表示进行非对称金字塔non-local 模块,其目的与self-attention的目的是相似的,但是其过程是不相同的。其具体的流程如下图所示:

该过程和Non-local block 过程相似,只不过是key 和 Value 进行了统一的下采样操作。

该过程对YFY_FYF​使用两次1x1 的卷积操作,得到non-local 模块中的query,key 和value.为了减少计算量使key=value,所以针对key 和 value 只进行一次Pyramid Pooling 操作,得到了新的特征表示,其他的过程与AFNB的过程相同,都是根据Query和Key计算出相关性矩阵,然后将相关性矩阵与Value的特征转置相乘得到最终的特征,再将这个特征与YFY_FYF​拼接,得到作者较为满意的图像特征表示,最后在采用双线性插值的方法将特征分辨率还原,从而得到了分割结果。

实验结果


可以看出效果还是不错的。

Asymmetric Non-local Neural Networks相关推荐

  1. Local Binary Convolutional Neural Networks ---卷积深度网络移植到嵌入式设备上?

    前言:今天他给大家带来一篇发表在CVPR 2017上的文章. 原文:LBCNN 原文代码:https://github.com/juefeix/lbcnn.torch 本文主要内容:把局部二值与卷积神 ...

  2. 62_LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks 2019 论文笔记

    LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks 三维卷积神经网络局部相位的揭示 目录 LP-3DCNN: Unv ...

  3. 3D卷积“LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks”

    LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks 3D卷积计算量大,消耗内存多,论文提出了修正的局部相量(ReLP ...

  4. 论文阅读003:《Learning local feature descriptors with triplets and shallow convolutional neural networks》

    论文链接:http://www.bmva.org/bmvc/2016/papers/paper119/paper119.pdf github链接:https://github.com/vbalnt/t ...

  5. [ICCV2019论文阅读]Asymmetric Non-local Neural Networks for Semantic Segmentation

    作者:Zhen Zhu, Mengde Xu, Song Bai, Tengteng Huang, Xiang Bai 机构:Huazhong University of Science and Te ...

  6. ANN:Asymmetric Non-local Neural Networks for Semantic Segmentation 文章解读

    <Asymmetric Non-local Neural Networks for Semantic Segmentation >文章解读 网络简介 文中提出了两个模块Asymmetric ...

  7. 吴恩达深度学习笔记——卷积神经网络(Convolutional Neural Networks)

    深度学习笔记导航 前言 传送门 卷积神经网络(Convolutional Neural Networks) 卷积神经网络基础(Foundations of Convolutional Neural N ...

  8. Paper:《Graph Neural Networks: A Review of Methods and Applications—图神经网络:方法与应用综述》翻译与解读

    Paper:<Graph Neural Networks: A Review of Methods and Applications-图神经网络:方法与应用综述>翻译与解读 目录 < ...

  9. 3.Deep Neural Networks for YouTube Recommendations论文精细解读

    一.总述 今天分享的是Deep Neural Networks for Y ouTube Recommendations这篇论文的一些核心,这篇论文被称为推荐系统工程实践领域的一篇神文,每一个细节都值 ...

最新文章

  1. 【git效率篇】在window上面的git bash 配置永久别名 快捷方式
  2. 如何使用AngularJS绑定到复选框值列表?
  3. python开多少进程合适_python多进程基础
  4. 用shp制作geoJson格式地图数据(shp convert to geoJson)
  5. 微信小程序 App()方法与getApp()方法
  6. 建议能在园子里面发布Silverlight2.0应用
  7. idea取消大小写自动提示
  8. [Win+RF]新人视角-快速上手RF的接口测试
  9. 2022主流技术 Appium+IOS 自动化测试环境搭建
  10. 商贸宝显示连接不到服务器,登录T1商贸宝就提示 服务器链接失败 请重新登录 这个怎么解决?...
  11. python凹多边形分割_在Python中OpenCV多边形的凹凸角点
  12. 迪文屏 DGUS采坑手册
  13. VMware Workstation 蓝屏
  14. 虚拟机下ROS调用笔记本摄像头
  15. Jquery定时弹广告
  16. 6、Flutter Widgets 之 InkWell 和 Ink
  17. SetChatRoomDesc 设置群公告
  18. linux下用vi,vim编辑时退出编辑模式(wq)无法保存退出
  19. CQL 函数及多深度关系节点
  20. 第二证券|钠离子电池将迎来量产 22股净利有望高增长

热门文章

  1. vue项目关闭eslint检查,vue关闭代码格式校验
  2. 影音全能播放器-KMPlayer提供下载
  3. 自定义函数5,is_leap_year判断是否为闰年
  4. 分享一个百度云资源不限速下载工具(含下载链接)
  5. 我与世界杯足球那些事——世界杯征文
  6. Orange Pi 香橙派 zero h2+ 实现DHT11 温湿度的读取 (附录代码也适用于 树莓派 DHT11)
  7. Ubuntu 上VS Code更新后 Remote-SSH 无法连接服务器:failed to install the vs code server!
  8. 2018年端午节书法作品集
  9. SSPU-BBS中的邮箱认证
  10. 【限速标志识别】基于matlab GUI形态学限速标志识别【含Matlab源码 1142期】