PP-YOLOE: An evolved version of YOLO

摘要

本文介绍了PP-YOLOE模型，一种SOTA的产业级目标检测器，具有性能高效和部署友好的特点。本文在之前的PP-YOLOv2的基础上进行优化，使用了anchor-free范式、更加强大的主干、配备CSPRepResStage的neck设计、ET-head以及动态标签分配算法TAL。本文对于不同的应用场景提供了s/m/l/x模型。实验结果显示，PP-YOLOE-l在COCO-test-dev上实现了51.4mAP，并且在Tesla-V100上的速度为78.1FPS，与之前的先进工业模型PP-YOLOv2和YOLOX相比，分别获得了（+1.9 AP, + 13.35%加速）和（+1.3AP, +24.96%加速）的显著提升。除此之外，PP-YOLOE的推理速度在使用TensorRT和FP16精度的条件下达到149.2FPS。本文还进行了大量的实验来验证本文设计的有效性。源代码和预训练模型请参见PaddleDetection。

1 引言

一阶段目标检测器由于其优秀的速度精度均衡性，常常用于实时应用中。在一阶检测器中最著名的架构是YOLO系列[21_YOLOv1, 22_YOLOv2, 23_YOLOv3, 2_YOLOv4, 26_ScaledYOLOv4, 14_YOLOv5, 6_YOLOX, 18_PP_YOLOv1, 13_PP_YOLOv2]。从YOLOv1[21_YOLOv1]开始，YOLO系列模型已经在网络结构、标签分配等方面发生了巨大的变化。目前，YOLOX[6_YOLOX]在Tesla-V100以速度68.9FPS达到50.1mAP，实现了速度精度的最佳均衡。
YOLOX引入了先进的anchor-free方法，并配备了动态标签分配，以提升检测器的性能，在精度上优于[14_YOLOv5]。

PP-YOLOE的译读笔记相关推荐

【IEEE Transactions NNLS】DSAN: Deep Subdomain Adaptation Network for Image Classification译读笔记
笔记摘要对于标注数据难以获取的目标任务来说,域自适应能够将知识从一个不同的源域中将知识迁移过来.之前的深度域自适应方法主要学习全局域漂移,即在全局上对齐源分布和目标分布,而不考虑两个同类别不同域的 ...
【NIPS 2020】Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for...译读笔记
论文名称 Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Dete ...
【CVPR 2021】VarifocalNet: An IoU-aware Dense Object Detector的译读笔记
论文 VarifocalNet: An IoU-aware Dense Object Detector 摘要准确排序大量候选框对dense检测器获得高精度是十分重要的.之前的工作使用类别分数或者类别 ...
ShuffleNetV2论文译读笔记
论文 Ma, Ningning, et al. "Shufflenet v2: Practical guidelines for efficient cnn architecture des ...
MobileNetV3论文译读笔记
论文 Searching for MobileNetV3 摘要本文提出了新一代的MobileNets模型,基于互补搜索技术的组合,同时这也是一种新型的架构设计.(实际上就是加入了NAS方法)Mobi ...
PicoDet论文译读笔记
PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices 摘要在目标检测中如何实现更好的精度-速度均衡是一个具有挑战性的问题. ...
CBNetV2论文的译读笔记
论文名称 CBNetV2: A Composite Backbone Network Architecture for Object Detection 摘要如今性能最好的目标检测器在很大程度上依赖 ...
KaimingInit论文的译读笔记
摘要 Rectified activation units (rectifiers)(即:整流激活单元,一般就是ReLU函数,因为在本文中Kaiming还提出了PReLU,所以他这里用的是" ...
MABN论文的译读笔记
摘要 BN是深度学习领域使用最广泛的方法之一:但是其性能会因为batch-size不足而严重下降.这个缺点限制了BN在某些计算机视觉任务上的应用,例如:检测和分割,某些情况下由于内存使用的限制batc ...
【TGRS】Ship Detection in Large-Scale SAR Images Via Spatial Shuffle-Group Enhance Attention译读笔记
论文信息 Ship Detection in Large-Scale SAR Images Via Spatial Shuffle-Group Enhance Attention 摘要使用SAR进行 ...

PP-YOLOE的译读笔记

PP-YOLOE: An evolved version of YOLO

摘要

1 引言

PP-YOLOE的译读笔记相关推荐

最新文章

热门文章