PP-YOLOE: An evolved version of YOLO

摘要

本文介绍了PP-YOLOE模型,一种SOTA的产业级目标检测器,具有性能高效和部署友好的特点。本文在之前的PP-YOLOv2的基础上进行优化,使用了anchor-free范式、更加强大的主干、配备CSPRepResStage的neck设计、ET-head以及动态标签分配算法TAL。本文对于不同的应用场景提供了s/m/l/x模型。实验结果显示,PP-YOLOE-l在COCO-test-dev上实现了51.4mAP,并且在Tesla-V100上的速度为78.1FPS,与之前的先进工业模型PP-YOLOv2和YOLOX相比,分别获得了(+1.9 AP, + 13.35%加速)(+1.3AP, +24.96%加速)的显著提升。除此之外,PP-YOLOE的推理速度在使用TensorRT和FP16精度的条件下达到149.2FPS。本文还进行了大量的实验来验证本文设计的有效性。源代码和预训练模型请参见PaddleDetection。

1 引言

  一阶段目标检测器由于其优秀的速度精度均衡性,常常用于实时应用中。在一阶检测器中最著名的架构是YOLO系列[21_YOLOv1, 22_YOLOv2, 23_YOLOv3, 2_YOLOv4, 26_ScaledYOLOv4, 14_YOLOv5, 6_YOLOX, 18_PP_YOLOv1, 13_PP_YOLOv2]。从YOLOv1[21_YOLOv1]开始,YOLO系列模型已经在网络结构、标签分配等方面发生了巨大的变化。目前,YOLOX[6_YOLOX]在Tesla-V100以速度68.9FPS达到50.1mAP,实现了速度精度的最佳均衡。
  YOLOX引入了先进的anchor-free方法,并配备了动态标签分配,以提升检测器的性能,在精度上优于[14_YOLOv5]。

PP-YOLOE的译读笔记相关推荐

  1. 【IEEE Transactions NNLS】DSAN: Deep Subdomain Adaptation Network for Image Classification译读笔记

    笔记 摘要 对于标注数据难以获取的目标任务来说,域自适应能够将知识从一个不同的源域中将知识迁移过来.之前的深度域自适应方法主要学习全局域漂移,即在全局上对齐源分布和目标分布,而不考虑两个同类别不同域的 ...

  2. 【NIPS 2020】Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for...译读笔记

    论文名称 Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Dete ...

  3. 【CVPR 2021】VarifocalNet: An IoU-aware Dense Object Detector的译读笔记

    论文 VarifocalNet: An IoU-aware Dense Object Detector 摘要 准确排序大量候选框对dense检测器获得高精度是十分重要的.之前的工作使用类别分数或者类别 ...

  4. ShuffleNetV2论文译读笔记

    论文 Ma, Ningning, et al. "Shufflenet v2: Practical guidelines for efficient cnn architecture des ...

  5. MobileNetV3论文译读笔记

    论文 Searching for MobileNetV3 摘要 本文提出了新一代的MobileNets模型,基于互补搜索技术的组合,同时这也是一种新型的架构设计.(实际上就是加入了NAS方法)Mobi ...

  6. PicoDet论文译读笔记

    PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices 摘要 在目标检测中如何实现更好的精度-速度均衡是一个具有挑战性的问题. ...

  7. CBNetV2论文的译读笔记

    论文名称 CBNetV2: A Composite Backbone Network Architecture for Object Detection 摘要 如今性能最好的目标检测器在很大程度上依赖 ...

  8. KaimingInit论文的译读笔记

    摘要 Rectified activation units (rectifiers)(即:整流激活单元,一般就是ReLU函数,因为在本文中Kaiming还提出了PReLU,所以他这里用的是" ...

  9. MABN论文的译读笔记

    摘要 BN是深度学习领域使用最广泛的方法之一:但是其性能会因为batch-size不足而严重下降.这个缺点限制了BN在某些计算机视觉任务上的应用,例如:检测和分割,某些情况下由于内存使用的限制batc ...

  10. 【TGRS】Ship Detection in Large-Scale SAR Images Via Spatial Shuffle-Group Enhance Attention译读笔记

    论文信息 Ship Detection in Large-Scale SAR Images Via Spatial Shuffle-Group Enhance Attention 摘要 使用SAR进行 ...

最新文章

  1. swoole php配置文件,easyswoole自义命令加载自定义配置文件
  2. 开始学习RED HAT LINUX了
  3. 无法安装声卡及MODEM驱动
  4. Django创建项目的命令
  5. java学习(74):GUL面板
  6. 【牛客 - 283E】贪心只能过样例(模拟)
  7. 关于html中css无法作用的问题
  8. bzoj 1626: [Usaco2007 Dec]Building Roads 修建道路(最小生成树)
  9. tiny4412 串口驱动分析五 --- LDD3上TTY驱动程序源码
  10. 基于Grafana的监控报警平台
  11. 关于gitlab启动后,浏览器git clone 还是localhost问题记录
  12. Java中Properties类的使用
  13. 标准logo大小尺寸设置标准是什么? logo大小参数详解。
  14. 英文版win10如何全屏玩英文版warcraft3
  15. C++primer十万字笔记 第九章 顺序容器
  16. 蓝牙协议栈模组在linux ubuntu 跑蓝牙协议栈 --传统蓝牙搜索演示以及实现原理
  17. Vue2的响应式原理
  18. Histcite使用
  19. 2020-10-05
  20. 生信技能9 - 生物信息分析必须掌握的生物学基本概念(建议收藏)

热门文章

  1. 热学仿真模型助力深层次理解半导体器件物理和优化制备工艺
  2. 手机整屏显示数据php,JavaScript实现移动端页面按手机屏幕分辨率自动缩放示例...
  3. 江苏银行软件测试工程师面试,【江苏银行面试|面试题】-看准网
  4. 我输入,你生成代码,手写代码生成
  5. 银行理财、货币基金和理财型基金的区别
  6. 米思齐二次开发程序解释
  7. php fopen创建文件,php fopen函数用法(打开创建文件)
  8. RTOS系统CPU使用率和任务堆栈空间统计方法
  9. PO、DO、TO、DTO都是什么?
  10. 冒险岛linux服务端 143端