PP-YOLOE的译读笔记
PP-YOLOE: An evolved version of YOLO
摘要
本文介绍了PP-YOLOE模型,一种SOTA的产业级目标检测器,具有性能高效和部署友好的特点。本文在之前的PP-YOLOv2的基础上进行优化,使用了anchor-free范式、更加强大的主干、配备CSPRepResStage的neck设计、ET-head以及动态标签分配算法TAL。本文对于不同的应用场景提供了s/m/l/x模型。实验结果显示,PP-YOLOE-l在COCO-test-dev上实现了51.4mAP,并且在Tesla-V100上的速度为78.1FPS,与之前的先进工业模型PP-YOLOv2和YOLOX相比,分别获得了(+1.9 AP, + 13.35%加速)和(+1.3AP, +24.96%加速)的显著提升。除此之外,PP-YOLOE的推理速度在使用TensorRT和FP16精度的条件下达到149.2FPS。本文还进行了大量的实验来验证本文设计的有效性。源代码和预训练模型请参见PaddleDetection。
1 引言
一阶段目标检测器由于其优秀的速度精度均衡性,常常用于实时应用中。在一阶检测器中最著名的架构是YOLO系列[21_YOLOv1, 22_YOLOv2, 23_YOLOv3, 2_YOLOv4, 26_ScaledYOLOv4, 14_YOLOv5, 6_YOLOX, 18_PP_YOLOv1, 13_PP_YOLOv2]。从YOLOv1[21_YOLOv1]开始,YOLO系列模型已经在网络结构、标签分配等方面发生了巨大的变化。目前,YOLOX[6_YOLOX]在Tesla-V100以速度68.9FPS达到50.1mAP,实现了速度精度的最佳均衡。
YOLOX引入了先进的anchor-free方法,并配备了动态标签分配,以提升检测器的性能,在精度上优于[14_YOLOv5]。
PP-YOLOE的译读笔记相关推荐
- 【IEEE Transactions NNLS】DSAN: Deep Subdomain Adaptation Network for Image Classification译读笔记
笔记 摘要 对于标注数据难以获取的目标任务来说,域自适应能够将知识从一个不同的源域中将知识迁移过来.之前的深度域自适应方法主要学习全局域漂移,即在全局上对齐源分布和目标分布,而不考虑两个同类别不同域的 ...
- 【NIPS 2020】Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for...译读笔记
论文名称 Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Dete ...
- 【CVPR 2021】VarifocalNet: An IoU-aware Dense Object Detector的译读笔记
论文 VarifocalNet: An IoU-aware Dense Object Detector 摘要 准确排序大量候选框对dense检测器获得高精度是十分重要的.之前的工作使用类别分数或者类别 ...
- ShuffleNetV2论文译读笔记
论文 Ma, Ningning, et al. "Shufflenet v2: Practical guidelines for efficient cnn architecture des ...
- MobileNetV3论文译读笔记
论文 Searching for MobileNetV3 摘要 本文提出了新一代的MobileNets模型,基于互补搜索技术的组合,同时这也是一种新型的架构设计.(实际上就是加入了NAS方法)Mobi ...
- PicoDet论文译读笔记
PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices 摘要 在目标检测中如何实现更好的精度-速度均衡是一个具有挑战性的问题. ...
- CBNetV2论文的译读笔记
论文名称 CBNetV2: A Composite Backbone Network Architecture for Object Detection 摘要 如今性能最好的目标检测器在很大程度上依赖 ...
- KaimingInit论文的译读笔记
摘要 Rectified activation units (rectifiers)(即:整流激活单元,一般就是ReLU函数,因为在本文中Kaiming还提出了PReLU,所以他这里用的是" ...
- MABN论文的译读笔记
摘要 BN是深度学习领域使用最广泛的方法之一:但是其性能会因为batch-size不足而严重下降.这个缺点限制了BN在某些计算机视觉任务上的应用,例如:检测和分割,某些情况下由于内存使用的限制batc ...
- 【TGRS】Ship Detection in Large-Scale SAR Images Via Spatial Shuffle-Group Enhance Attention译读笔记
论文信息 Ship Detection in Large-Scale SAR Images Via Spatial Shuffle-Group Enhance Attention 摘要 使用SAR进行 ...
最新文章
- swoole php配置文件,easyswoole自义命令加载自定义配置文件
- 开始学习RED HAT LINUX了
- 无法安装声卡及MODEM驱动
- Django创建项目的命令
- java学习(74):GUL面板
- 【牛客 - 283E】贪心只能过样例(模拟)
- 关于html中css无法作用的问题
- bzoj 1626: [Usaco2007 Dec]Building Roads 修建道路(最小生成树)
- tiny4412 串口驱动分析五 --- LDD3上TTY驱动程序源码
- 基于Grafana的监控报警平台
- 关于gitlab启动后,浏览器git clone 还是localhost问题记录
- Java中Properties类的使用
- 标准logo大小尺寸设置标准是什么? logo大小参数详解。
- 英文版win10如何全屏玩英文版warcraft3
- C++primer十万字笔记 第九章 顺序容器
- 蓝牙协议栈模组在linux ubuntu 跑蓝牙协议栈 --传统蓝牙搜索演示以及实现原理
- Vue2的响应式原理
- Histcite使用
- 2020-10-05
- 生信技能9 - 生物信息分析必须掌握的生物学基本概念(建议收藏)