​作者丨happy
编辑丨极市平台
本文原创首发于极市平台公众号,转载请获得授权并标明出处。

文章链接:https://arxiv.org/pdf/2109.07217.pdf

代码链接:https://github.com/zimoqingfeng/UMOP

本文是百度的研究员在目标检测领域的最新力作,对一个被“遗忘”的地带(金字塔层级目标分布不平衡)进行了探索。首先,作者基于FPN架构对不同检测器的不同层级目标分布进行了分析并得出:不同层级目标分布确实存在Level Imbalance问题;基于所发现问题,从现有固定参数FocalLoss出发设计了一种新的PFL损失;与此同时,针对训练过程中难易样例的角色转换现象提出了渐进式动态调整超参的机制进行更进一步的改善。值得一提的是,所提UMOP一种“即插即用”、“无损涨点”的模块,它可以轻易的嵌入到现有一阶段检测器中并大幅提升检测性能,性能提升高达~1.5AP。不得不说,百度最近两年最detection方面的工作还是非常值得称道的,顶!

Abstract

在目标检测领域,多级预测(比如FPN、YOLO)与重采样技术(如Focal Loss、ATSS)极大的提升了一阶段检测器性能。然而,如何通过逐级优化特征金字塔提升性能尚未进行探索。我们发现:在训练过程中,不同金字塔层级的正负样例比例是不同的,即存在Level Imbalance,而这尚未被一阶段检测器解决。

为缓解Level Imbalance影响,本文提出一种UMOP(Unified Multi-level Optimization Paradigm),它包含两个成分:

  • An independent classification loss supervising each pyramid level with individual resampling considerations;

  • A progressive hard-case mining loss defining all losses across the pyramid levels without extra level-wise settings.

基于所提即插即用UMLP机制,现有一阶段检测可以用更少的训练迭代次数取得~1.5AP指标提升,且不会导致额外的计算负担。所得最佳模型在COCO test-dev数据集上取得了55.1AP指标

本文主要由以下三点贡献:

  • 本文首次证实:FPN性能在某种程度上会受到Level Imbalanced影响

  • 集成与所提UMOP,现有一阶段检测器可以用更少的训练迭代次数取得~1.5AP指标提升,且不会导致额外的计算负担;

  • 在COCO test-dev数据集上,最佳模型取得了截至目前最高的55.1AP指标(一阶段检测器)。

全文链接:在目标检测被“遗忘”领域进行探索后,百度开源最新力作UMOP:即插即用、无痛涨点

在目标检测被“遗忘”领域进行探索后,百度开源最新力作UMOP:即插即用、无痛涨点相关推荐

  1. 目标检测排行榜_3D领域重大突破!大华股份人工智能取得KITTI Object 3D车辆检测排行榜第一名...

    [导读]近日,大华股份基于深度学习技术研发的3D目标检测技术,刷新了The KITTI Vision Benchmark Suite中3D车辆类目检测任务(3D Object Detection Ev ...

  2. 多模态深度学习综述总结 与 目标检测多模态融合领域论文推荐

    文章目录 一.多模态学习定义及应用 二.模态表示 2.1 单模态表示 2.1.1 语句模态表示 2.1.2 视觉模态表示 2.1.3 声音模态表示(略) 2.2 多模态表示 2.2.1 模态共作用语义 ...

  3. 深度学习目标检测在游戏领域的应用

    原理 1.每秒15-25次截取指定窗口屏幕(录屏原理),帧率不用那么高比职业选手快就可以 2.根据每帧截取的图片进行目标检测推理返回所有敌人坐标 3.根据坐标计算截图中所有敌人的头部中心点 4.计算选 ...

  4. 我扔掉FPN来做目标检测,效果竟然这么强!YOLOF开源:你只需要看一层特征

    作者丨happy 编辑丨极市平台 导读 旷视科技&中科院对单阶段目标检测中的FPN进行了重思考,采用一级特征进行检测替换复杂的特征金字塔来解决优化问题,提出了YOLOF.该方法取得了与Reti ...

  5. 目标检测的稀疏对抗攻击,代码已开源

    题目:Sparse Adversarial Attack to Object Detection 论文:https://arxiv.org/pdf/2012.13692v1.pdf 代码:https: ...

  6. retinanet 部署_目标检测RetinaNet_飞桨-源于产业实践的开源深度学习平台

    目标检测-RetinaNet 类别 计算机视觉(PaddleCV) 应用 图像搜索 安防监控 自动驾驶 智慧城市 机器人视觉 模型概述 经典的一阶段框架,由ResNet主干网络.FPN结构.和两个分别 ...

  7. 无人驾驶领域的3D目标检测综述

    论文阅读笔记<3D Object Detection for Autonomous Driving: A Review and New Outlooks> github链接:https:/ ...

  8. 目标检测YOLO实战应用案例100讲-无监督领域自适应目标检测方法研究与应用

    目录 无监督领域自适应目标检测方法研究 领域自适应目标检测 目标检测相关技术介绍

  9. 7 Papers Radios | NeurIPS 2020最佳论文;全卷积网络实现E2E目标检测

    机器之心 & ArXiv Weekly Radiostation 参与:杜伟.楚航.罗若天 本周的重要研究包括 NeurIPS 2020最佳论文以及抛弃 Transformer 使用全卷积网络 ...

最新文章

  1. saltstack/salt的state.sls的使用
  2. leetcode252. 会议室
  3. 二叉树知识点最详细最全讲解
  4. ioca0中断 pic单片机_单片机入门知识-PIC为例程序.ppt
  5. 中文设置_lol手游台服怎么设置中文?lol手游台服中文的具体设置教程
  6. LeetCode 396. 旋转函数(Rotate Function)
  7. ansible mysql plugin_Ansible--Module
  8. Selenium自动化框架:数据驱动、关键字驱动和混合
  9. HDU-3401 Trade 单调队列优化DP
  10. Navicat注册机报错No all pattern found! file already patched
  11. PHP 框架集成使用 UEditor 编辑器的方法
  12. Java基础:第5-6章(重点)
  13. kelvin模型蠕变方程_开尔文模型.ppt
  14. 第二章:python必备基础语法
  15. 2022.6.20-6.26 AI行业周刊(第103期):新的小生命
  16. 3GPP TS 29244-g30 中英文对照 | 5.11 User plane inactivity detection and reporting
  17. Mybatis源码分析--关联表查询及延迟加载原理(二)
  18. 大象装企营销:该如何做一场促销活动?
  19. linux上如何安装git
  20. Redis(3.2.3)集群部署实战

热门文章

  1. Nginx使用Location匹配URL进行伪静态
  2. 浏览器上网 (Safari Chrome)
  3. [转]掌控像素的虚实
  4. access labsql 出错_一段由ACCESS转为SQL SERVER后出现的CINT错误
  5. Qtcreator快速入门
  6. SpringMVC(四)——Ajax技术
  7. Python-OpenCV--直线提取
  8. Python 3.6安装教程
  9. linux系统实用脚本,常用linux系统命令及简单小脚本
  10. matlab小波三维图,matlab小波包变换估计时变功率谱三维图出图和理想不一样