文章目录

  • 前言
  • Swim Transformer V2
  • Swin Transformer
  • Dynamic Head
  • YOLOF
  • YOLOR
  • YOLOX
  • Scaled-YOLOv4
  • Scale-Aware Trident Networks
  • DETR
  • Dynamic R-CNN

前言

之前目标检测综述一文中详细介绍了目标检测相关的知识,本篇博客作为扩展补充,记录目前(2022)目标检测的最新进展,主要是在coco test-dev上霸榜且知名度较广的目标检测网络。具体详情可参考相关论文或者代码。

Swim Transformer V2

论文地址:Swin Transformer V2: Scaling Up Capacity and Resolution
代码地址:Swim Transformer V2 Code
该方法展示了将Swim Transformer扩展到30亿个参数并使其能够使用高达1536输入尺寸的图像进行训练的sota探讨。通过扩大网络容量和分辨率,Swim Transformer在四个具有代表性的视觉基准上创造了记录:ImageNet-V2 图像分类的 84.0% top-1 准确率,COCO 对象检测的 63.1/54.4 box/mask mAP,ADE20K 语义分割的 59.9 mIoU, Kinetics-400 视频动作分类的 top-1 准确率为 86.8%。Swin Transformer V2使用的技术通常为扩大视觉模型,但它没有像 NLP 语言模型那样被广泛探索,部分原因在于训练和应用方面,存在以下困难:1)视觉模型经常面临大规模不样本不均衡的问题;2)许多下游视觉任务需要高分辨率图像或滑动窗口,目前尚不清楚如何有效地将低分辨率预训练的模型转换为更高分辨率的模型;3)当图像分辨率很高时,GPU 内存消耗也是一个问题。为了解决这些问题,该研究团队提出了几种技术,并通过使用 Swin Transformer 作为案例研究来说明:1)后归一化技术和缩放余弦注意方法来提高大型视觉模型的稳定性;2) 一种对数间隔的连续位置偏差技术,可有效地将在低分辨率图像和窗口上预训练的模型转移到其更高分辨率的对应物上。此外,团队分享了关键实现细节,这些细节可以显著节省 GPU 内存消耗,从而使使用常规 GPU 训练大型视觉模型的方案变得可行。

Swin Transformer

论文:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
代码:Swin Transformer Code


Dynamic Head

论文:Dynamic Head: Unifying Object Detection Heads with Attentions
代码:Dynamic Head Code

YOLOF

论文:You Only Look One-level Feature
代码:YOLOF Code

YOLOR

论文:You Only Learn One Representation: Unified Network for Multiple Tasks
代码:YOLOR Code

YOLOX

论文:YOLOX: Exceeding YOLO Series in 2021
代码:YOLOX Code

Scaled-YOLOv4

论文:Scaled-YOLOv4: Scaling Cross Stage Partial Network
代码:Scaled-YOLOv4 Code



Scale-Aware Trident Networks

论文:Scale-Aware Trident Networks for Object Detection
代码:Scale-Aware Trident Networks Code


DETR

论文:End-to-End Object Detection with Transformers
代码:DETR Code


Dynamic R-CNN

论文:Dynamic R-CNN: Towards High Quality Object Detection via Dynamic Training
代码:Dynamic R-CNN Code

目标检测2022最新进展相关推荐

  1. YOLOX:高性能目标检测的最新实践 | 报告详解

    近年来,目标检测的工程应用研究中,YOLO系列以快速响应.高精度.结构简单以及容易部署的特点备受工程研究人员的青睐.同时,YOLO系列存在需要手工设定样本正负导致模型泛化能力较差的问题.为了解决此类问 ...

  2. 青源LIVE第22期|旷视刘松涛:YOLOX,高性能目标检测的最新实践

    在目标检测领域中,YOLO系列以其一贯以来的高速度.高精度和算子简单.易部署的特性,在工业界中得到广泛的好评和应用. 近两年来,学术界在Anchor Free和样本匹配(Label Assignmen ...

  3. 人脸检测研究最新进展

    摘 要:人脸检测研究在近几十年的时间内取得了长足的进步,在生活中的各个方面得到了广泛的应用.本文首先对人脸检测进行了简单的介绍,然后介绍了人脸检测的两个比较大的评测网站,人脸检测的评价指标,在后续介绍 ...

  4. Google出品,EfficientNet在目标检测达到最新SOTA | CVPR 2020

    作者 | tanmingxing,rpang,qvl 来源 | 晓飞的算法工程笔记() 介绍 目前目标检测领域,高精度的模型通常需要很大的参数量和计算量,而轻量级的网络则一般都会牺牲精度.因此,论文希 ...

  5. 基于深度学习的目标检测的研究进展2

    普通的深度学习监督算法主要是用来做分类,如图1(1)所示,分类的目标是要识别出图中所示是一只猫.而在ILSVRC(ImageNet Large Scale Visual Recognition Cha ...

  6. 深度卷积神经网络在目标检测中的进展

    作者:travelsea 链接:https://zhuanlan.zhihu.com/p/22045213 来源:知乎 近些年来,深度卷积神经网络(DCNN)在图像分类和识别上取得了很显著的提高.回顾 ...

  7. Flink 容错恢复 2.0 2022 最新进展

    摘要:本文整理自阿里云 Flink 存储引擎团队负责人,Apache Flink 引擎架构师 & PMC 梅源在 FFA 核心技术专场的分享.主要介绍在 2022 年度,Flink 容错 2. ...

  8. 【NLP】万字长文带你解读『虚假新闻检测』最新进展

    NewBeeNLP原创出品 公众号专栏作者 @byn blog | https://blog.csdn.net/byn12345 互联网时代,假新闻铺天盖地,而且极具迷惑性,因此假新闻检测任务对逻辑的 ...

  9. 史上最全综述:3D目标检测算法汇总!

    来源:自动驾驶之心 本文约16000字,建议阅读10+分钟 本文将演示如何通过阈值调优来提高模型的性能.本文的结构安排如下:首先,第2节中介绍了3D目标检测问题的定义.数据集和评价指标.然后,我们回顾 ...

最新文章

  1. UVA1660 电视网络 Cable TV Network(网络流,最小割)
  2. 解决一个坑爹的mininet的pingall失败的问题(自己编译安装openvswitch后)
  3. 我的新浪微博,顺便总结下近况
  4. ubuntu pdf转jpg或txt
  5. jquery 幻灯片图像切换效果
  6. Linux系统自启动脚本
  7. SAP Fiori Launchpad里加载abap.js的具体代码位置
  8. 摆脱困境:向REST API添加验证
  9. 在Windows上,迁移VisualSVN server
  10. 04_使用Influxdb自带函数查询
  11. 平均薪资 38.4 万!3 步教你成为区块链开发者,收好这份学习指南!
  12. Kneron用“重组”方案精简深度学习算法,芯片产品明年开售
  13. php 织梦手册,Dede标签快速手册
  14. 【Language model】使用RNN LSTM训练语言模型 写出45°角仰望星空的文章
  15. 怎样才能跳过实名认证_和平精英qq怎么跳过实名认证!老司机告诉你仅需5步
  16. CentOS7救援模式重置root密码
  17. 科学计算极速图形工作站
  18. Mac下 用户的Library文件夹怎么找
  19. 技术胖的2019新版React全家桶免费视频(84集)
  20. CUIT J2EE 第二次课内容

热门文章

  1. Page Rank查询工具 | Page Rank Checker
  2. 为长颈鹿做一个名片二维码,扫描就能了解它的详细信息
  3. redis设置过期时间与直接detele key有什么区别
  4. 计算机网络(考研复试)
  5. 我就是那个在上海假装生活的人
  6. 程序员正确看代码的方式
  7. 悲壮!微软钦定的13部 Windows Phone 遗老
  8. 华为、华三设备日常工作使用配置命令
  9. 算法实验总结2019
  10. Android BLE 蓝牙开发指南(三)外围设备端开发详解