Asymmetric Non-local Neural Networks
Asymmetric Non-local Neural Networks
论文:Asymmetric Non-local Neural Networks for Semantic Segmentation,ICCV,2019.
链接:paper
代码:github
本文是在Non-local Neural Networks(cvpr,2018) 这篇论文的基础上改进得来的,non-local block Non-local模块作为语义分割任务中很有用的技术,但因为计算量较大,需要较大的显存开销,这阻碍了non-local network在实际应用中的使用。本文提出了APNB来减少non-local block的计算量和显存开销,AFNB通过提升分割性能增强non-local block的学习能力。我们着重分析这篇论文的改进点。
Revisiting Non-local Block
输入
1.经过3个1x1的卷积Query,Key和Value变换之后,分别得到 : ,
,
2.计算所有空间位置特征向量的相似度:
3.归一化:
4.根据所有空间位置特征向量的相似度加权求和:
5.新特征经过1*1卷积变换后与原输入特征拼接:
计算复杂度:
Asymmetric Pyramid Non-local Block(APNB)
Non-local 的计算复杂度主要来自第2步和第4步:
可以看出经N(红色)改变为S,不会改变输出的size。
将N 减小到S ,相当于从θ 和 γ 采样一些特征点,代替使用HxW空间范围的点,如上图1(b)所示,增加两个sample模块Pθ和PγP_θ 和 P_γPθ和Pγ,采样一些稀疏的锚点和
,S就是锚点的数量。
1.经过3个1x1的卷积Query,Key和Value变换之后,分别得到,
,
2.采样:,
3.计算所有空间位置与S个采样点的特征相似度:
4.归一化:
5.根据相似度加权求和:
5.新特征经过1X1卷积变换后与原输入特征拼接:
计算复杂度:
可以看出sample之后,S(110)<<N,则该模型就大大减少了计算复杂度和内存开销。
分割网络框架
由于作者将传统的non-local模型中的N经过Sample操作之后变成了较小的S,这样就不能捕捉到每个像素点之间的相关性信息,可能会造成效果不是很好,为了使模型性能进一步的提升,作者又在考虑长依赖性的情况下融合不同级别下的特征。
作者提出的非对称non-local网络的框架如下图所示:
首先作者采用ResNet - 101 网络作为模型的backbone,并且去掉了原模型中最后两个下采样层,使用空洞卷积来保持最后两个阶段得到的特征分辨率是原图像的1/8,作者将stage4和stage5的输出用AFNB模块进行融合,作者将Stage5得到的特征称为high-level 特征,将stage4得到的特征称为low-level特征,将这两个特征输入AFNB模块进行融合,其具体的过程如下图:
该模块将stage5产生的高级特征作为Query,将stage4得到的低级特征作为Key 和 Value,首先对Query,Key和Value 分别使用1x1 的卷积核进行降维,根据Asymmetric non-local 网络的特征需要进行Pyramid Pooling 操作,来对Key 和 Value 进行进一步的特征抽取,从而得到较小的特征表示。
APNB锚点采样策略
通过金字塔池化(何凯明在fast-rcnn 中提出的)对Key路径和Value路径得到的特征图和
进行下采样,得到
和
使用4中不同的池化操作:{1,3,6,8},然后将池化后的特征图展开成一维向量,拼接起来,一共得到 110 个锚点。经过Pyramid Pooling操作后原本CN大小的特征变成了大小为CS的特征矩阵,然后计算Query和Key的相关性矩阵计算,就是将Query转置后与Key相乘最终得到一个N*S的相关性矩阵,最后,将这个相关性矩阵与Value 特征进行转置相乘最终得到了不同leve下的特征融合表示OFO_FOF,最后将这个表示与Stage5输出的特征拼接后得到原始图像最新的特征表示YFY_FYF.
然后对得到的最新的特征表示进行非对称金字塔non-local 模块,其目的与self-attention的目的是相似的,但是其过程是不相同的。其具体的流程如下图所示:
该过程和Non-local block 过程相似,只不过是key 和 Value 进行了统一的下采样操作。
该过程对YFY_FYF使用两次1x1 的卷积操作,得到non-local 模块中的query,key 和value.为了减少计算量使key=value,所以针对key 和 value 只进行一次Pyramid Pooling 操作,得到了新的特征表示,其他的过程与AFNB的过程相同,都是根据Query和Key计算出相关性矩阵,然后将相关性矩阵与Value的特征转置相乘得到最终的特征,再将这个特征与YFY_FYF拼接,得到作者较为满意的图像特征表示,最后在采用双线性插值的方法将特征分辨率还原,从而得到了分割结果。
实验结果
可以看出效果还是不错的。
Asymmetric Non-local Neural Networks相关推荐
- Local Binary Convolutional Neural Networks ---卷积深度网络移植到嵌入式设备上?
前言:今天他给大家带来一篇发表在CVPR 2017上的文章. 原文:LBCNN 原文代码:https://github.com/juefeix/lbcnn.torch 本文主要内容:把局部二值与卷积神 ...
- 62_LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks 2019 论文笔记
LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks 三维卷积神经网络局部相位的揭示 目录 LP-3DCNN: Unv ...
- 3D卷积“LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks”
LP-3DCNN: Unveiling Local Phase in 3D Convolutional Neural Networks 3D卷积计算量大,消耗内存多,论文提出了修正的局部相量(ReLP ...
- 论文阅读003:《Learning local feature descriptors with triplets and shallow convolutional neural networks》
论文链接:http://www.bmva.org/bmvc/2016/papers/paper119/paper119.pdf github链接:https://github.com/vbalnt/t ...
- [ICCV2019论文阅读]Asymmetric Non-local Neural Networks for Semantic Segmentation
作者:Zhen Zhu, Mengde Xu, Song Bai, Tengteng Huang, Xiang Bai 机构:Huazhong University of Science and Te ...
- ANN:Asymmetric Non-local Neural Networks for Semantic Segmentation 文章解读
<Asymmetric Non-local Neural Networks for Semantic Segmentation >文章解读 网络简介 文中提出了两个模块Asymmetric ...
- 吴恩达深度学习笔记——卷积神经网络(Convolutional Neural Networks)
深度学习笔记导航 前言 传送门 卷积神经网络(Convolutional Neural Networks) 卷积神经网络基础(Foundations of Convolutional Neural N ...
- Paper:《Graph Neural Networks: A Review of Methods and Applications—图神经网络:方法与应用综述》翻译与解读
Paper:<Graph Neural Networks: A Review of Methods and Applications-图神经网络:方法与应用综述>翻译与解读 目录 < ...
- 3.Deep Neural Networks for YouTube Recommendations论文精细解读
一.总述 今天分享的是Deep Neural Networks for Y ouTube Recommendations这篇论文的一些核心,这篇论文被称为推荐系统工程实践领域的一篇神文,每一个细节都值 ...
最新文章
- 【git效率篇】在window上面的git bash 配置永久别名 快捷方式
- 如何使用AngularJS绑定到复选框值列表?
- python开多少进程合适_python多进程基础
- 用shp制作geoJson格式地图数据(shp convert to geoJson)
- 微信小程序 App()方法与getApp()方法
- 建议能在园子里面发布Silverlight2.0应用
- idea取消大小写自动提示
- [Win+RF]新人视角-快速上手RF的接口测试
- 2022主流技术 Appium+IOS 自动化测试环境搭建
- 商贸宝显示连接不到服务器,登录T1商贸宝就提示 服务器链接失败 请重新登录 这个怎么解决?...
- python凹多边形分割_在Python中OpenCV多边形的凹凸角点
- 迪文屏 DGUS采坑手册
- VMware Workstation 蓝屏
- 虚拟机下ROS调用笔记本摄像头
- Jquery定时弹广告
- 6、Flutter Widgets 之 InkWell 和 Ink
- SetChatRoomDesc 设置群公告
- linux下用vi,vim编辑时退出编辑模式(wq)无法保存退出
- CQL 函数及多深度关系节点
- 第二证券|钠离子电池将迎来量产 22股净利有望高增长
热门文章
- vue项目关闭eslint检查,vue关闭代码格式校验
- 影音全能播放器-KMPlayer提供下载
- 自定义函数5,is_leap_year判断是否为闰年
- 分享一个百度云资源不限速下载工具(含下载链接)
- 我与世界杯足球那些事——世界杯征文
- Orange Pi 香橙派 zero h2+ 实现DHT11 温湿度的读取 (附录代码也适用于 树莓派 DHT11)
- Ubuntu 上VS Code更新后 Remote-SSH 无法连接服务器:failed to install the vs code server!
- 2018年端午节书法作品集
- SSPU-BBS中的邮箱认证
- 【限速标志识别】基于matlab GUI形态学限速标志识别【含Matlab源码 1142期】