前言

之前目标检测综述一文中详细介绍了目标检测相关的知识，本篇博客作为扩展补充，记录目前（2022）目标检测的最新进展，主要是在coco test-dev上霸榜且知名度较广的目标检测网络。具体详情可参考相关论文或者代码。

Swim Transformer V2

论文地址：Swin Transformer V2: Scaling Up Capacity and Resolution
代码地址：Swim Transformer V2 Code
该方法展示了将Swim Transformer扩展到30亿个参数并使其能够使用高达1536输入尺寸的图像进行训练的sota探讨。通过扩大网络容量和分辨率，Swim Transformer在四个具有代表性的视觉基准上创造了记录：ImageNet-V2 图像分类的 84.0% top-1 准确率，COCO 对象检测的 63.1/54.4 box/mask mAP，ADE20K 语义分割的 59.9 mIoU， Kinetics-400 视频动作分类的 top-1 准确率为 86.8%。Swin Transformer V2使用的技术通常为扩大视觉模型，但它没有像 NLP 语言模型那样被广泛探索，部分原因在于训练和应用方面，存在以下困难：1）视觉模型经常面临大规模不样本不均衡的问题；2）许多下游视觉任务需要高分辨率图像或滑动窗口，目前尚不清楚如何有效地将低分辨率预训练的模型转换为更高分辨率的模型；3）当图像分辨率很高时，GPU 内存消耗也是一个问题。为了解决这些问题，该研究团队提出了几种技术，并通过使用 Swin Transformer 作为案例研究来说明：1）后归一化技术和缩放余弦注意方法来提高大型视觉模型的稳定性；2) 一种对数间隔的连续位置偏差技术，可有效地将在低分辨率图像和窗口上预训练的模型转移到其更高分辨率的对应物上。此外，团队分享了关键实现细节，这些细节可以显著节省 GPU 内存消耗，从而使使用常规 GPU 训练大型视觉模型的方案变得可行。

Swin Transformer

论文：Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
代码：Swin Transformer Code

Dynamic Head

论文：Dynamic Head: Unifying Object Detection Heads with Attentions
代码：Dynamic Head Code

YOLOF

论文：You Only Look One-level Feature
代码：YOLOF Code

YOLOR

论文：You Only Learn One Representation: Unified Network for Multiple Tasks
代码：YOLOR Code

YOLOX

论文：YOLOX: Exceeding YOLO Series in 2021
代码：YOLOX Code

Scaled-YOLOv4

论文：Scaled-YOLOv4: Scaling Cross Stage Partial Network
代码：Scaled-YOLOv4 Code

Scale-Aware Trident Networks

论文：Scale-Aware Trident Networks for Object Detection
代码：Scale-Aware Trident Networks Code

DETR

论文：End-to-End Object Detection with Transformers
代码：DETR Code

Dynamic R-CNN

论文：Dynamic R-CNN: Towards High Quality Object Detection via Dynamic Training
代码：Dynamic R-CNN Code

目标检测2022最新进展相关推荐

YOLOX：高性能目标检测的最新实践 | 报告详解
近年来,目标检测的工程应用研究中,YOLO系列以快速响应.高精度.结构简单以及容易部署的特点备受工程研究人员的青睐.同时,YOLO系列存在需要手工设定样本正负导致模型泛化能力较差的问题.为了解决此类问 ...
青源LIVE第22期｜旷视刘松涛：YOLOX，高性能目标检测的最新实践
在目标检测领域中,YOLO系列以其一贯以来的高速度.高精度和算子简单.易部署的特性,在工业界中得到广泛的好评和应用. 近两年来,学术界在Anchor Free和样本匹配(Label Assignmen ...
人脸检测研究最新进展
摘要:人脸检测研究在近几十年的时间内取得了长足的进步,在生活中的各个方面得到了广泛的应用.本文首先对人脸检测进行了简单的介绍,然后介绍了人脸检测的两个比较大的评测网站,人脸检测的评价指标,在后续介绍 ...
Google出品，EfficientNet在目标检测达到最新SOTA | CVPR 2020
作者 | tanmingxing,rpang,qvl 来源 | 晓飞的算法工程笔记() 介绍目前目标检测领域,高精度的模型通常需要很大的参数量和计算量,而轻量级的网络则一般都会牺牲精度.因此,论文希 ...
基于深度学习的目标检测的研究进展2
普通的深度学习监督算法主要是用来做分类,如图1(1)所示,分类的目标是要识别出图中所示是一只猫.而在ILSVRC(ImageNet Large Scale Visual Recognition Cha ...
深度卷积神经网络在目标检测中的进展
作者:travelsea 链接:https://zhuanlan.zhihu.com/p/22045213 来源:知乎近些年来,深度卷积神经网络(DCNN)在图像分类和识别上取得了很显著的提高.回顾 ...
Flink 容错恢复 2.0 2022 最新进展
摘要:本文整理自阿里云 Flink 存储引擎团队负责人,Apache Flink 引擎架构师 & PMC 梅源在 FFA 核心技术专场的分享.主要介绍在 2022 年度,Flink 容错 2. ...
【NLP】万字长文带你解读『虚假新闻检测』最新进展
NewBeeNLP原创出品公众号专栏作者 @byn blog | https://blog.csdn.net/byn12345 互联网时代,假新闻铺天盖地,而且极具迷惑性,因此假新闻检测任务对逻辑的 ...
史上最全综述：3D目标检测算法汇总！
来源:自动驾驶之心本文约16000字,建议阅读10+分钟本文将演示如何通过阈值调优来提高模型的性能.本文的结构安排如下:首先,第2节中介绍了3D目标检测问题的定义.数据集和评价指标.然后,我们回顾 ...

目标检测2022最新进展

文章目录

前言