1. 简介

来自2016年论文《Training Region-based Object Detectors with Online Hard Example Mining》。在线困难样本挖掘OHEM(Online Hard Example Mining)。如字面意思,OHEM加强了对困难样例的检测,提高了mAP。

Bootstrapping算法,指的就是利用有限的样本资料经由多次重复抽样,重新建立起足以代表母体样本分布的新样本。Bootstrapping现在经常叫做hard negative mining。作者把OHEM当作一个新颖的Bootstrapping技术。

物体检测一般有两种方法,一种是overfeat那样,采用sliding-window 检测方法;一种是像R-CNN,使用region proposal。OHEM是基于第二种,以Fast R-CNN为例,其他region 方法也可以用。

将OHEM应用于Fast R-CNN有下面3个好处:

  1. 去除了一些region-based 卷积网络中的启发式和超参数;
  2. 提升了mAP;
  3. 当训练数据变得更大、更困难,该方法更有效。

2.网络结构

原Fast R-CNN,结构如下。

下图是加了OHEM后的Fast R-CNN结构:包含两个RoI network,其中一个是只读的RoI network,一个是标准的RoI network。只读的RoI network仅为所有RoI的前向传输分派记忆,而另一个标准的RoI network为前向和后向传输都分配记忆。

在一个SGD迭代中,有了conv feature map后,只读的RoI network作用前向传输,计算所有输入RoI的损失(绿色箭头),将这些RoI 损失排序,hard sampling 模块选择前B个表现较差的hard example(R_hard-sel),将其输入到标准的RoI network(红色箭头)。标准的RoI network仅对R_hard-sel计算前向、后向传输,累计梯度并让他们通过卷积网络。

3.花里胡哨技巧

  1. Multi-sacle:采用图片的多尺度进行训练、预测。
  2. 迭代bounding-box 回归:采用了两次迭代。

效果如下图,提高了mAP:

4.检测结果

下表的ours代表OHEM,可以看到采用OHEM的mAP效果很好。

论文笔记OHEM(Online Hard Example Mining)相关推荐

  1. 论文笔记 OHEM: Training Region-based Object Detectors with Online Hard Example Mining

    CVPR2016的文章,CMU与rbg大神的合作.原谅我一直没有对这篇文章做一个笔记~~ 文章提出了一种通过online hard example mining(OHEM)算法训练基于区域的卷积检测算 ...

  2. Focal Loss 论文笔记

    论文:<Focal Loss for Dense Object Detection> 论文地址:https://arxiv.org/abs/1708.02002 代码地址: 官方 gith ...

  3. 论文笔记目录(ver2.0)

    1 时间序列 1.1 时间序列预测 论文名称 来源 主要内容 论文笔记:DCRNN (Diffusion Convolutional Recurrent Neural Network: Data-Dr ...

  4. 《区块链跨链技术进展研究》论文笔记

    <区块链跨链技术进展研究>论文笔记 1 前言 2 区块链的跨链需求及技术难点 2.1 区块链跨链的研究目的 2.2 区块链跨链主流的解决方案 2.2.1 公证人机制 2.2.2 侧链/中继 ...

  5. 《Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network》论文笔记

    <Improved Crowd Counting Method Based onScale-Adaptive Convolutional Neural Network>论文笔记 论文地址 ...

  6. 深度学习新的采样方式和损失函数--论文笔记

    深度学习新的采样方式和损失函数--论文笔记 论文<Sampling matters in deep embedding learning> 论文地址:https://arxiv.org/p ...

  7. NLP论文笔记合集(持续更新)

    NLP论文笔记合集(持续更新) 经典论文 参考文献 情感分析论文 关键词 综述 参考文献 非综述 参考文献 其他论文 参考文献 经典论文 2003年发表的文章1^11,NLP经典论文:NNLM 笔记 ...

  8. 【时序】应用于时间序列的 Transformer 综述论文笔记

    论文名称:Transformers in Time Series: A Survey 论文下载:https://arxiv.org/abs/2202.07125 论文源码:https://github ...

  9. ORB-SLAM3 论文笔记

    ORB-SLAM3 论文笔记 这篇博客 ORB-SLAM3系统 相机模型的抽象(Camera Model) 重定位的问题 图片矫正的问题 视觉惯性SLAM的工作原理 相关公式 IMU初始化 跟踪和建图 ...

最新文章

  1. vuecli3的svgicon_vue-cli3引入svg图标全过程以及遇到的坑
  2. WEBMIN管理Centos5.2 or RedHat5.2以上版本时samba用户不能同步系统帐户
  3. 【算法】一个简单的决策树(DT)原理
  4. 什么是ACID理论(二阶段、三阶段提交、TCC)
  5. 论图书营销中的“托”
  6. vscode创建代码截图_如何在VSCode中创建代码配置文件
  7. 同一台服务器上部署多个Tomcat的配置修改方法
  8. Excel从右向左查找
  9. 入门Sysmac Studio,白菜妹子是这样做的。
  10. chrome书签搜索
  11. windows--bat--通过bat批处理写入.reg文件在注册
  12. Sonic 开源移动端云真机测试平台 - 用例编写与回放流程实例演示,任务定时执行、图像相似度定位、公共步骤、公共参数、测试套件等
  13. Arcgis 地理配准步骤(底图校正)
  14. 各平均数介绍(算数平均数、几何平均数、加权算术平均数)
  15. 关于java中输出流flush()方法
  16. 【Roofline 推理速度】影响深度学习模型推理速度的因素及相关基础知识
  17. android简单录音机波形,android 录音机源码(带波形显示)
  18. ADO.NET是什么
  19. python 生成随机数据,随机中文,英文,数字,姓名等
  20. Linux sha-bang 是什么? #!

热门文章

  1. 一段简单的计算机程序举例,第3讲-最简单的C语言程序举例.docx
  2. css 让图片不停的转动
  3. 乔布斯画传:漫长而辉煌的CEO生涯
  4. html5组件库,资源 | 10套好用的前端框架、设计组件库推荐
  5. oracle字段加约束,添加/删除约束(Oracle)
  6. 招商头条:雄安新区二十条措施促传统产业转型升级;蒲城县签约40个项目总投资178.3亿
  7. 《视频直播技术详解》系列:(0)汇总
  8. shell中的数组详解
  9. 看图就懂:为什么L1正则化比L2正则化更容易得到稀疏解?为什么L2正则化可以用于防止过拟合?
  10. 哈夫曼树的构造(C语言)