之前用faster r-cnn做object detection,感觉非常好。这篇文章对faster r-cnn做了一些改进,进行人脸检测。
下面就讲下做了哪些改进。

0. Overview

先看下整体的流程

基础网络采用VGG-16
(1)首先用wilder face对faster r-cnn进行预训练。
(2)难例挖掘
(3)fine-tuning(这一过程涉及本文的3大改进:利用难例、特征连接、多尺度输入)

1. Feature Concatenation


我们知道,RoI pooling是从卷积层的最后一层产生的feature map上提取特征的。
但是,由于深层网络的feature map具有更大的感受野,因此会失去很多细粒度信息,失去很多分辨率信息。

因此,本文提出:分别对多个卷积层池化后的feature map进行RoI pooling 操作。

如图,将多个卷积层池化后产生的feature maps分别进行RoI pooling操作,然后把池化后的feature map在深度上相连接,构成一个新的更深的feature map。
进行1x1的卷积后,变成固定长度的特征向量,传递至FC。

2. hard negative mining

难例挖掘,这个应该不用多说。本文则是对第一步中预训练网络(dataset:wilder face)产生的hard negative进行再训练。

判断难例的方法是:如果一个region的confidence大于0.8,但它与GT的IoU小于0.5。

则我们将它直接存下来,作为finetuning网络的RoI(dataset:FDDB),直接投入分类器进行训练。

3. Multi-Scale Training

随机使用3种尺度中的一种,投入到网络中。实验结果表明,使用多尺度可以让网络对于不同尺寸的图像更鲁棒。

4. 实验相关

有些东西和faster r-cnn一样,有些不一样。做个简短的review。
(1) 12个anchor,非9个
(2) lr = 0.0001
(3) fast r-cnn分类器:正(IoU>0.5) 负(IoU<0.5)
(4) RPN产生100个region proposal

人脸检测之Improved Faster R-CNN相关推荐

  1. Faster R CNN

    Faster R CNN 3 FASTER R-CNN 我们的Faster R CNN 由两个模块组成,第一个模块是 proposes regions 的全卷积网络,第二个是使用 proposed r ...

  2. 1500+ FPS!目前最快的CNN人脸检测算法开源

    1500+ FPS!目前最快的CNN人脸检测算法开源 项目地址: https://github.com/ShiqiYu/libfacedetection 深圳大学的于仕琪老师发布的人脸检测库:libf ...

  3. 自然场景人脸检测技术实践

    一. 背景 人脸检测技术是通过人工智能分析的方法自动返回图片中的人脸坐标位置和尺寸大小,是人脸智能分析应用的核心组成部分,具有广泛的学术研究价值和业务应用价值,比如人脸识别.人脸属性分析(年龄估计.性 ...

  4. 人脸检测(十九)--人脸检测综述(2018.2)

    本文转自:https://zhuanlan.zhihu.com/p/32702868,若侵即删.这篇文章,偏工程实用,不是学术界意义上的检测综述,所以,有些阐述,过于绝对化.挑着看吧. 人脸检测系列博 ...

  5. 人脸检测背景介绍和发展现状

    本文转自:https://zhuanlan.zhihu.com/p/32702868,若侵即删.这篇文章,偏工程实用,不是学术界意义上的检测综述,所以,有些阐述,过于绝对化.挑着看吧. 人脸检测系列博 ...

  6. 人脸检测背景介绍写的很好,请看知乎原文,https://zhuanlan.zhihu.com/p/32702868

    知乎原文, https://zhuanlan.zhihu.com/p/32702868 #if 0 写这个系列的动机有两点:(第零是农药双排队友周末经常有事,没人一起玩,)第一,检测和跟踪之间有斩不断 ...

  7. 利用MTCNN和facenet实现人脸检测和人脸识别

    利用MTCNN和facenet实现人脸检测和人脸识别 人脸检测和人脸识别技术算是目前人工智能方面应用最成熟的技术了.本博客将利用mtcnn和faceNet搭建一个实现人脸检测和人脸识别的系统.基本思路 ...

  8. 人脸检测概述(不是人脸识别)

    目录 1  引言... 3 2  人脸检测技术的发展与现状... 4 3  人脸检测算法相关工作... 4 3.1  评价指标... 5 3.2  人脸检测常用数据库... 6 3.2.1  FDDB ...

  9. OpenCV神技——人脸检测,猫脸检测

    简介   OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux.Windows.Android和Mac OS操作系统上.它轻量级而且高效--由一系列 C 函数和少量 ...

最新文章

  1. 微软谈开源、赦盗版背后的商业逻辑
  2. Linux命令之uname
  3. 分布式任务队列 Celery — 实践
  4. 因为此版本的应用程序不支持其项目类型(.vcproj)的解决方法
  5. etl报表开发是什么意思_中间表是什么?和报表有什么关系?会带来怎样的问题?又如何解决?...
  6. 如何进行需求矩阵管理
  7. 为什么你的 JavaScript 代码如此冗长?!
  8. V - 不容易系列之(4)――考新郎(第二季水)
  9. 国民生产总值饼状图_预期寿命和国内生产总值
  10. 【2016.11.28】纯HTML仿微博注册页面
  11. Win32创建菜单篇
  12. 第五人格怎么投屏 轻松玩电脑版手游
  13. 春节购机如何选?老司机会告诉你买华为Mate 20 Pro
  14. 宝塔修改网站中的文件后未生效
  15. 如何开搓饵不掉钩_防止小鱼闹钩的方法
  16. PS仔细抠图(头发处的处理)
  17. 【C# 】反射,调用.dll文件里面的方法
  18. [DEP_WEBPACK_COMPILATION_ASSETS] DeprecationWarning: Compilation.assets will be frozen in future
  19. 西雅图Oracle公寓租赁,西雅图Seattle租房攻略
  20. 载波同步DPSK(相干调制)

热门文章

  1. 10秒钟,chatgpt帮你生成简单贪吃蛇游戏
  2. 大学物理东北大学网课版 预习笔记
  3. 下一个五年,我们还可以做些什么
  4. 基于Halcon学习的缺陷检测【一】detect_mura_blur.hdev
  5. Ubuntu 20.04编译WebRTC
  6. VIVE开发基础(A、快速入门篇)(Yanlz+HTC+VIVE+VR+AR+MR+XR+SteamVR+CameraRig+LightHouse+HeadSet+Teleport+立钻哥哥+)
  7. 让生活积极向上的五种方式
  8. Springboot项目开发(三)文件结构(个人理财系统)
  9. 学到了一个新东西叫塞瓦维斯特定理
  10. PNG的增强格式:MNG[转载]