一、目标检测之Softer-NMS

Bounding Box Regression with Uncertainty for Accurate Object Detection

  • 论文链接:https://arxiv.org/abs/1809.08545
  • 论文翻译:https://blog.csdn.net/weixin_42662134/article/details/88967206
  • 论文详解:https://blog.csdn.net/lcczzu/article/details/86518615
  • 论文代码:https://github.com/yihui-he/softer-NMS

二、Softer-NMS算法

1、论文动机

目前NMS会出问题的情况:

1)所有的候选包围框都不够精确(这时候该选择哪一个?或者有没有可能综合这些候选框的信息提高精度?);

2)拥有高的分类分数的候选包围框不精确(如何更有效地评价候选框的定位精度?)

如下图:

图中(a)展示了2个均在某些坐标不精确的候选包围框,(b)展示了定位精度高的候选框分类分数较低。

以上检测失败的例子都表明,定位置信度并不是与分类置信度强相关(事实上好的分类器应该对定位信息不敏感)。

2、论文算法思想

  • 首先假设预测的bounding box的是高斯分布:
  • ground truth bounding box是狄拉克delta分布(既标准方差为0的高斯分布极限):

    上个式子里面的delta分布是当高斯分布的σ趋于0时的极限分布,大概就是这样:

    当σ越小,曲线越瘦高,当σ非常小的时候,几乎是一条竖直的线,同时σ越小,表示越确定,因此1−σ可以作为置信度的。

网络架构:

KL 散度用来衡量两个概率分布的非对称性度量,KL散度越接近0代表两个概率分布越相似。

论文提出的KL loss,即为最小化Bounding box regression loss,即Bounding box的高斯分布和ground truth的狄拉克delta分布的KL散度。直观上解释,KL Loss使得Bounding box预测呈高斯分布,且与ground truth相近。而将包围框预测的标准差看作置信度


我们估计值的高斯分布,对应蓝色和灰色的曲线。橙色的曲线是ground-truth对应的狄拉克函数。当预测bbox位置没被估计准确,我们期望预测结果有更大的方差,这样Lreg会比较低(蓝色)。

使用KL loss进行回归:

最终推导后损失函数:

为了避免梯度爆炸,我们的网络实际中预测的是α=log(σ²)α=log(σ²),而不是σ;

var voting(方差投票)

得到上述置信度,即可以在Soft NMS后进一步改进,将大于一定重叠度阈值Nt的候选包围框根据置信度加权平均。(因为在训练的时候寻求包围框预测的方差小,所以这一步加权平均后不会出现框出来“四不像”的情况)

计算过程如下:

结果


目标检测之Softer-NMS相关推荐

  1. 目标检测中的NMS,soft NMS,softer NMS,Weighted Boxes Fusion

    NMS 非最大值抑制算法,诞生至少50年了. 在经典的两阶段目标检测算法中,为了提高对于目标的召回率,在anchor阶段会生成密密麻麻的anchor框. 所以在后处理的时候,会存在着很多冗余框对应着同 ...

  2. 目标检测模型中NMS、soft-NMS、softer-NMS的原理、LNMS文本检测系列(python代码实现)

    非极大值抑制NMS的作用: 是目标检测框架中的后处理模块,主要用于删除高度冗余的bbox. ?一.NMS[参考] 非极大值抑制NMS的过程: 根据置信度得分进行排序: 选择置信度最高的边界框添加到最终 ...

  3. 目标检测学习笔记——NMS、置信度、IOU

    一.NMS 非极大值抑制用在最后阶段,即所有边界框都已经回归调整过后,对图片每一类使用NMS防止一个目标出现多个边界框. 1.非极大值抑制需要设置一个阈值 2.使用时间是最后调整完预测框位置后 3.多 ...

  4. 【目标检测系列】非极大值抑制(NMS)的各类变体汇总

    关注上方"深度学习技术前沿",选择"星标公众号", 技术干货,第一时间送达! [导读]前面已经先后为大家详细介绍过了目标检测领域的基础知识:[目标检测基础积累] ...

  5. 最全综述 | 图像目标检测

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 前言 图片分类任务我们已经熟悉了,就是算法对其中的对象进行分类.而 ...

  6. 解读目标检测新范式:Segmentations is All You Need

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 多年来,基于候选区域网络(RPN)的现有模型在目标检测任务中得到了 ...

  7. 目标检测---Segmentation Is All You Need

    Segmentation Is All You Need https://www.jiqizhixin.com/articles/2019-06-02-2 目前目标检测算法中有两个模块比较重要: re ...

  8. 带你深入AI(4)- 目标检测领域:R-CNN,faster R-CNN,yolo,SSD, yoloV2

    带你深入AI(4)- 目标检测领域:R-CNN,faster R-CNN,yolo,SSD, yoloV2 2018年04月15日 11:09:29 阅读数:103 1 引言 深度学习目前已经应用到了 ...

  9. 【深度学习】CornerNet: 将目标检测问题视作关键点检测与配对

    前言: CornerNet于2019年3月份提出,CW近期回顾了下这个在当时引起不少关注的目标检测模型,它的亮点在于提出了一套新的方法论--将目标检测转化为对物体成对关键点(角点)的检测.通过将目标物 ...

  10. CornerNet: 将目标检测问题视作关键点检测与配对

    前言: CornerNet于2019年3月份提出,CW近期回顾了下这个在当时引起不少关注的目标检测模型,它的亮点在于提出了一套新的方法论--将目标检测转化为对物体成对关键点(角点)的检测.通过将目标物 ...

最新文章

  1. 计算机科学精彩帖子收集
  2. [转载] 全本张广泰——第十七回 夫人诱广泰 血溅洪洞县
  3. 动手写 framebuffer 画点、划线程序 (七)
  4. UI组件之TextView及其子类(二)RadioButton和CheckBox
  5. UFLDL教程: Exercise: Implement deep networks for digit classification
  6. 《零基础看得懂的C语言入门教程 》——(二)C语言没那么难简单开发带你了解流程
  7. LeetCode —— 深搜水题记录
  8. linux下找不到sqlite3头文件,关于CentOS 7下sqlite3找不到的问题解决
  9. Excel生成随机数
  10. Atitit 项目语言的选择 java c#.net  php??
  11. 搭建安卓开发环境 GIT配色 terminator SecureCRT source insight Notepad++安装
  12. 数字图像处理 matlab 报告总结,matlab数字图像处理实验报告
  13. fox邮箱新建的服务器,foxmail新建账户创建其他邮箱的操作步骤
  14. 模糊控制-模糊性知识的表示问题
  15. 大数据论坛圆满落幕 开启海南房地产大数据时代
  16. ubuntu 开机进不去桌面问题
  17. selenium如何接管(控制)已打开Chrome浏览器
  18. photoshop ps 瘦身方法 液化工具
  19. 屏蔽eslint检测某项报错
  20. java如何判断回文数

热门文章

  1. 洛谷1710 地铁涨价
  2. Python+Vue计算机毕业设计美食网站设计与实现62e76(源码+程序+LW+部署)
  3. # 标题Windows最强神器,WIN+R的最骚使用方法!
  4. lucene spatial 6.1搜索附近的饭店
  5. 樊氏族谱2-汝南樊银后裔家谱续谱-简书
  6. Python:游戏:测试打字速度
  7. 工商管理专业知识与实务(初级)【2】
  8. Yuma格式历书的总结
  9. svn发布网站(转载于badb0y)
  10. Linux内核分析2:一个简单的时间片轮转多道程序内核代码分析