Swin Transformer : Hierarchical Vision Transformer using Shifted Windows
论文地址
本文主要研究学习一种新的Transformer架构——Swin Transformer,其目的:新建一个通用架构
Transfoemer从NLP应用到CV领域存在以下几个挑战:
痛点:CV中视觉块的变化尺度大;图像像素的高分辨率;——动机
- scale:视觉元素在规模上可能有很大的差异;
- High Resolution:像素级,更高分辨率,自注意力的计算复杂度是二次的。
本文:提出一个Hierarchical(分层)Transformer ,通过shifted windows(Swin)进行特征表示,将自注意力限制在无重叠的局部窗口,结合交叉窗口连接——模型灵活,在图像分类、稠密预测(目标检测、语义分割),都取得了一定提升。获得了更低的时延。
Hierarchical(分层)Transformer——捕获分层特征图+线性复杂度
- 分层特征图:小尺寸的patch,融合neighbor patch
- 线性复杂度:计算局部自注意力机制,fixed patch,local
- 核心:连续的自注意层之间移动窗口分区
架构学习
- swin transformer block:用基于Shifted-window替代原标准多头自注意力模块,线性复杂度替代二次计算。
- 基于自注意力的移动窗口:局部窗口自注意力计算;窗口间的连接(移动窗口分区方案);
- 第一个模块使用从左上角像素开始的规则窗口划分策略(New),将8×8特征映射均匀划分为2个大小为4×4的窗口。然后,下一个模块采用一种窗口配置,从前一层的窗口配置中移动,通过从规则划分的窗口中替换(M/2,M/2)像素的窗口。
- 针对移位配置的高效批计算:以前的pad的填充再屏蔽的方法,在窗口过小的情况下,会提高计算量;本文整改:循环移位-向左上方移动。——降低计算量。
Deconvolution - 简书 (jianshu.com)
Swin Transformer : Hierarchical Vision Transformer using Shifted Windows相关推荐
- 【读点论文】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows通过窗口化进行局部MSA,sw-MSA融合信息
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows abstract 本文提出了一种新的视觉transfor ...
- Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
目录 Introduction Method Hierarchical feature maps and Linear computational complexity Patch merging S ...
- 【文献阅读】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
题目:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 时间:2021 会议/期刊:ICCV 2021 研 ...
- 【Transformer 论文精读】……Swin Transformer……(Hierarchical Vision Transformer using Shifted Windows)
文章目录 一.Abstract(摘要) 二.Introduction(引言) 三.Related Work(相关工作) 四.Method(方法) 1.Patch Merging模块 2.W-MSA模块 ...
- 【Swin Transformer】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
文章:https://arxiv.org/abs/2103.14030 代码:GitHub - microsoft/Swin-Transformer: This is an official impl ...
- 论文阅读笔记:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
论文阅读笔记:Swin Transformer 摘要 1 简介 2 相关工作 3 方法论 3.1 总览 Swin Transformer block 3.2 shifted window-based ...
- Swin Transformer: Hierarchical Vision Transformer using Shifted Windows论文阅读
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows论文阅读 摘要 介绍 相关工作 方法 整个架构 基于sel ...
- 13、Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
简介 主页:https://github. com/microsoft/Swin-Transformer. Swin Transformer 是 2021 ICCV最佳论文,屠榜了各大CV任务,性能优 ...
- Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 论文翻译 + 网络详解
目录 1 3 4 5 是论文的翻译,如果看过论文也可以直接看关于网络的结构详解. Abstract 1. Introduction 3. Method 3.1 Overall Architicture ...
- Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 阅读理解
原文地址:https://arxiv.org/pdf/2103.14030.pdf 收录:CVPR 2021 Best paper 代码: https://github.com/microsoft/S ...
最新文章
- 【转】ASP.NET之 关于触发Global.asax Session_End事件的经验
- 如何应对云爆发架构?四种方法替你解忧
- automake linux,Linux下automake软件编译与发布快速入门
- 前端学习(2344):高阶组件和函数子组件
- 正确使用PresentModalViewController
- hive mysql性能_Hive数据库安全审计功能
- python excel详解_Python - excel 详解
- 运用js解决java selenium元素定位问题
- 人工智能为什么不用C语言,Ai人工智能和C语言差不多吗
- mac 谷歌浏览器必备插件
- c语言 dct变换,汇编实现的DCT变换算法
- 实战7:机器学习实战之 随机森林、逻辑回归、SVM算法方法进行垃圾邮件过滤分类 代码+数据
- php redis incr过期时间,Redis 利用 incr 和 expire 来限流, 并发导致过期时间失效问题...
- OpenCV学习(13) 细化算法(1)
- 虚拟电脑服务器玩梦幻西游卡吗,vmware虚拟机 玩梦幻西游很卡有什么解决方法...
- 用java做一个能赚钱的微信群聊机器人(PC协议)
- 超导体的性质,不研究制备
- 微信小程序-06 tab选项卡滑动切换与列表Item(scroll 、 swiper)数据的获取等所用到的都有了
- arcgis api for js地图符号的使用(使用Draw绘制图形)
- Niagara station站点打不开,怎么办?
热门文章
- bzoj 3453 tyvj 1858 XLkxc 拉格朗日插值
- 产品日记:如何去做产品
- 手机里的文件被覆盖如何恢复
- kali爆破wifi密码测试
- 名爵如何解除限速_新国标电动车限速怎么解除
- Python+selenium自动化测试——启动谷歌浏览器闪退问题 Traceback (most recent call last)
- 从光的波粒二相性所想到的.......(非物理范畴)
- 南瑞新一代平台告警表变化内容
- 仙剑奇侠传3 灵珠修改法
- 什么是3D角色设计?以及角色设计师的工作是什么?