论文地址

本文主要研究学习一种新的Transformer架构——Swin Transformer,其目的:新建一个通用架构

Transfoemer从NLP应用到CV领域存在以下几个挑战

痛点:CV中视觉块的变化尺度大;图像像素的高分辨率;——动机

  • scale:视觉元素在规模上可能有很大的差异;
  • High Resolution:像素级,更高分辨率,自注意力的计算复杂度是二次的。

本文:提出一个Hierarchical(分层)Transformer ,通过shifted windows(Swin)进行特征表示,将自注意力限制在无重叠的局部窗口,结合交叉窗口连接——模型灵活,在图像分类、稠密预测(目标检测、语义分割),都取得了一定提升。获得了更低的时延。

Hierarchical(分层)Transformer——捕获分层特征图+线性复杂度

  • 分层特征图:小尺寸的patch,融合neighbor patch
  • 线性复杂度:计算局部自注意力机制,fixed patch,local
  • 核心:连续的自注意层之间移动窗口分区

架构学习

  • swin transformer block:用基于Shifted-window替代原标准多头自注意力模块,线性复杂度替代二次计算。
  • 基于自注意力的移动窗口:局部窗口自注意力计算;窗口间的连接(移动窗口分区方案);
  • 第一个模块使用从左上角像素开始的规则窗口划分策略(New),将8×8特征映射均匀划分为2个大小为4×4的窗口。然后,下一个模块采用一种窗口配置,从前一层的窗口配置中移动,通过从规则划分的窗口中替换(M/2,M/2)像素的窗口。
  • 针对移位配置的高效批计算:以前的pad的填充再屏蔽的方法,在窗口过小的情况下,会提高计算量;本文整改:循环移位-向左上方移动。——降低计算量。

Deconvolution - 简书 (jianshu.com)

Swin Transformer : Hierarchical Vision Transformer using Shifted Windows相关推荐

  1. 【读点论文】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows通过窗口化进行局部MSA,sw-MSA融合信息

    Swin Transformer: Hierarchical Vision Transformer using Shifted Windows abstract 本文提出了一种新的视觉transfor ...

  2. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

    目录 Introduction Method Hierarchical feature maps and Linear computational complexity Patch merging S ...

  3. 【文献阅读】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

    题目:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 时间:2021 会议/期刊:ICCV 2021 研 ...

  4. 【Transformer 论文精读】……Swin Transformer……(Hierarchical Vision Transformer using Shifted Windows)

    文章目录 一.Abstract(摘要) 二.Introduction(引言) 三.Related Work(相关工作) 四.Method(方法) 1.Patch Merging模块 2.W-MSA模块 ...

  5. 【Swin Transformer】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

    文章:https://arxiv.org/abs/2103.14030 代码:GitHub - microsoft/Swin-Transformer: This is an official impl ...

  6. 论文阅读笔记:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

    论文阅读笔记:Swin Transformer 摘要 1 简介 2 相关工作 3 方法论 3.1 总览 Swin Transformer block 3.2 shifted window-based ...

  7. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows论文阅读

    Swin Transformer: Hierarchical Vision Transformer using Shifted Windows论文阅读 摘要 介绍 相关工作 方法 整个架构 基于sel ...

  8. 13、Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

    简介 主页:https://github. com/microsoft/Swin-Transformer. Swin Transformer 是 2021 ICCV最佳论文,屠榜了各大CV任务,性能优 ...

  9. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 论文翻译 + 网络详解

    目录 1 3 4 5 是论文的翻译,如果看过论文也可以直接看关于网络的结构详解. Abstract 1. Introduction 3. Method 3.1 Overall Architicture ...

  10. Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 阅读理解

    原文地址:https://arxiv.org/pdf/2103.14030.pdf 收录:CVPR 2021 Best paper 代码: https://github.com/microsoft/S ...

最新文章

  1. 【转】ASP.NET之 关于触发Global.asax Session_End事件的经验
  2. 如何应对云爆发架构?四种方法替你解忧
  3. automake linux,Linux下automake软件编译与发布快速入门
  4. 前端学习(2344):高阶组件和函数子组件
  5. 正确使用PresentModalViewController
  6. hive mysql性能_Hive数据库安全审计功能
  7. python excel详解_Python - excel 详解
  8. 运用js解决java selenium元素定位问题
  9. 人工智能为什么不用C语言,Ai人工智能和C语言差不多吗
  10. mac 谷歌浏览器必备插件
  11. c语言 dct变换,汇编实现的DCT变换算法
  12. 实战7:机器学习实战之 随机森林、逻辑回归、SVM算法方法进行垃圾邮件过滤分类 代码+数据
  13. php redis incr过期时间,Redis 利用 incr 和 expire 来限流, 并发导致过期时间失效问题...
  14. OpenCV学习(13) 细化算法(1)
  15. 虚拟电脑服务器玩梦幻西游卡吗,vmware虚拟机 玩梦幻西游很卡有什么解决方法...
  16. 用java做一个能赚钱的微信群聊机器人(PC协议)
  17. 超导体的性质,不研究制备
  18. 微信小程序-06 tab选项卡滑动切换与列表Item(scroll 、 swiper)数据的获取等所用到的都有了
  19. arcgis api for js地图符号的使用(使用Draw绘制图形)
  20. Niagara station站点打不开,怎么办?

热门文章

  1. bzoj 3453 tyvj 1858 XLkxc 拉格朗日插值
  2. 产品日记:如何去做产品
  3. 手机里的文件被覆盖如何恢复
  4. kali爆破wifi密码测试
  5. 名爵如何解除限速_新国标电动车限速怎么解除
  6. Python+selenium自动化测试——启动谷歌浏览器闪退问题 Traceback (most recent call last)
  7. 从光的波粒二相性所想到的.......(非物理范畴)
  8. 南瑞新一代平台告警表变化内容
  9. 仙剑奇侠传3 灵珠修改法
  10. 什么是3D角色设计?以及角色设计师的工作是什么?