Anchor DETR: Query Design for Transformer-Based Detector

(2021.9)

1.DETR的object query是学习的,没有物理意义也不能解释每个query注意哪。作者认为学习出来的object query不能关注特定的区域。本文提出来,object query的是基于anchor point的,这种设计下,每个object query只关注anchor点周围的目标,另外,每个object query可以在一个位置上预测多个目标(多模式)。

2.设计了一种注意力变体,可以减少内存成本。

Introduction

本文基于DETR做改进,肯定得先说一下DETR的优点就是一个可学习的object query集合来推理目标物和全局图像的关系。然后转折,说DETR局限了,也就是学习到的object query难以解释,也不能关注特定位置。

这幅图来自DETR原文,每个图像代表一个object query,点代表最后预测到的目标的位置,可以看到,各个关注的区域很大。没有关注特定位置所以限制了效果。

Motivation

  1. 回顾了CNN-based检测器,anchors包含可解释的物理信息并且对位置高度关联。所以提出了基于anchor point的新颖的query设计。我们编码anchor point的坐标作为object query,这样object query就有明确的物理意义了。
  1. 让每个object query关注特定位置,会带来问题:一个object query只能预测一个目标,如果那个location有多个目标物呢?作者给出解答:可以让其他的object query协助预测啊,可以让每个object query负责较大区域啊。

所以object query设计,对每个anchor point添加了多个模式,使每个anchor point可以预测多个目标。上图中分别表示三种模式的预测结果分布,能看出关注在anchor point周围。

  1. 设计了一种注意力变体-- Row-Column Decouple Attention (RCDA)

它将2D的key feature解耦成1D的行特征和1D的列特征,然后依次进行行注意与列注意。RCDA可以在保障性能前提下减少内存成本。

相关工作

  1. Anchors in Object Detection

CNN-based的检测器可分为两种:anchor box与anchor point(anchor-free);

DETR两者都没有采用,而是一种直接预测目标的方式。

作者发现将anchor point引入object query更好。

  1. Transformer Detector
  2. Efficient Attention

Method

  1. Anchor Points
  1. Cnn-based检测器中,anchor point总是在feature map的相应位置。但在transformer-based检测器中更灵活,anchor point可以是被学习的点,均匀的网格点,或者其他人工划分的点。本文选择前两者。
  1. 均匀划分的点;(b)随机初始化,采用0-1的均匀分布并可以学习的点。
  1. 有了anchor point,预测边界框的中心位置(ˆCx,ˆCy)将被添加到相应的anchor point作为最终预测,就像在Deformable DETR中一样
  1. Attention Formulation

下标f表示特征,p表示position embedding。

DETR的decoder有两种:self-attention & cross-attention。

Self-attention中:KfVfQf相同;KpQp相同。

  1. Anchor Points to Object Query

(2)式中Qp是可学习的编码(in DETR),但是,本文提出了新的object query设计方式。

  1. Multiple Predictions for Each Anchor Point
  1. Row-Column Decoupled Attention

通过1-D全局平均池化,将wh*c的key-feature解耦成w*c 与 h*c。

Experiments

Anchor DETR相关推荐

  1. 旷视孙剑团队提出Anchor DETR:基于Transformer的目标检测新网络

    开放了预训练,r50 400多m 写在前面 在本文中,作者提出了一种基于Transformer的目标检测器.在以前基于Transformer的检测器中,目标的查询是一组可学习的embedding.然而 ...

  2. 多快好省的目标检测器来了,旷视孙剑团队提出Anchor DETR:基于Anchor Point的DETR

    作者丨小马 编辑丨极市平台 本文原创首发于极市平台公众号,转载请获得授权并标明出处. [写在前面] 在本文中,作者提出了一种基于Transformer的目标检测器.在以前基于Transformer的检 ...

  3. 高效!Anchor DETR:旷视提出一种基于Transformer的目标检测神器!

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:Sophia知乎 https://zhuanlan.zhihu.com/p/412738375 985人工智能 ...

  4. DAB-DETR: DYNAMIC ANCHOR BOXES ARE BETTER QUERIES FOR DETR翻译

    点击下载论文 代码 摘要 我们在本篇论文中展示一种新颖的查询公式,即在 DETR上使用动态锚框 (DEtection TRansformer)并深入了解查询在DETR中的作用.这种新公式直接使用盒子坐 ...

  5. DAB-DETR:Dynamic Anchor Boxes Are Better Queries for DETR阅读笔记

    DAB-DETR阅读笔记 (一) Title (二) Summary (三) Problem Statement (四) Method 4.1 为什么位置先验能够加速训练? 4.2 本文的主要工作 4 ...

  6. 深度学习之目标检测(十一)--DETR详解

    深度学习之目标检测(十一)-- DETR详解 目录 深度学习之目标检测(十一)-- DETR详解 1. 前言 2. DETR 框架 2.1 CNN Backbone 2.2 Transformer E ...

  7. 计算机视觉算法——基于Transformer的目标检测(DETR / Deformable DETR / DETR 3D)

    计算机视觉算法--基于Transformer的目标检测(DETR / Deformable DETR / DETR 3D) 计算机视觉算法--基于Transformer的目标检测(DETR / Def ...

  8. DETR系列大盘点 | 端到端Transformer目标检测算法汇总!

    点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心[目标检测]技术交流群 后台回复[2D检测综述]获取鱼眼检测.实时检测.通用2D检测等近 ...

  9. DN-DETR: Accelerate DETR Training by Introducing Query DeNoising

    文章目录 DN-DETR: Accelerate DETR Training by Introducing Query DeNoising Abstract 1.Introduction 2. Rel ...

最新文章

  1. 前端性能毫秒必争方案(一)HTTP请求
  2. 法大大刘谦:法务智能化创新实践与行业趋势
  3. 【RecyclerView】 十五、使用 ItemTouchHelper 实现 RecyclerView 拖动排序 ( ItemTouchHelper 简介 )
  4. 查找字符位置_如何使用find函数和search函数精确查找字符
  5. angularjs 路由 异步加载js
  6. Fedora 13 正确安装 VirtualBox 3.2.x 的 步骤
  7. python输出名片_Python的格式化输出--制作名片
  8. html点击文本框唤醒手机键盘,html移动应用 input 标签 清除按钮功能如何实现(不触发键盘)...
  9. 原来系统还能这么装!教你虚拟光驱Daemon重装win10
  10. python-selenium自动化测试网页
  11. ASP.NET CORE WEB应用(有数据库操作的应用)发布到IIS
  12. 支付宝异步通知 asp
  13. 菜孔孔学python--字典
  14. Kubernetes 1.25 正式发布,多方面重大突破
  15. Linux常用工具使用手册——文件MD5的验证方法
  16. 开发物联网,ThingsPanel和ThingsBoard哪个更快更好
  17. 450g吐司烘烤温度_解决这24个问题,吐司面包想失败都难!
  18. html5 数值文本框,HTML5新控件 - 数值输入框
  19. VS更改窗体名字比较
  20. 普通话测试第四题评分标准_2017年普通话水平测试评分细则「详细版」

热门文章

  1. 【Vue实用功能】Vue实现文档在线预览功能,在线预览PDF、Word、Excel、ppt等office文件
  2. 现在已经不是我们的江湖了
  3. fiddler抓包安卓夜神模拟器配置
  4. uniapp js 按钮 点击事件 防抖节流 防抖和节流事件的触发
  5. 【FME实战教程】001:FME2020中文安装图文教程(附安装包下载)
  6. 我的世界服务器网页商城,《我的世界》【PC】版Hypixel服务器商城正式上线啦!...
  7. 关于App端使用微软云的一点笔记
  8. layer弹出层详解
  9. 麻辣香锅病毒手杀思路
  10. mysql删除数据库中重复的数据