1.目标检测

本文包含以下内容:

目标检测算法概述
用于检测的后处理方法
新的度量标准:平均精度中值(mAP)
TensorFlow目标检测API
训练和监测神经网络的提示和技巧

2.基于区域CNNs (RCNNs) I 

选择性搜索

目标检测算法的第一次迭代依赖于选择性搜索,一种在图像中分割区域的迭代算法(http://www.huppelen.nl/publications/selectiveSearchDraft.pdf)。

RCNN (Region-Based CNN)家族的第一篇论文使用选择性搜索创建的区域作为卷积神经网络的输入。这篇2014年的论文(https://arxiv.org/pdf/1311.2524.pdf)中,通过选择性搜索创建的区域,在输入到CNN之前将其调整到固定大小的分辨率。

尽管在性能方面取得了突破,但这种架构仍有一些缺点:

需要将每个区域的大小调整为固定大小的输入
   需要重新计算每个区域的CNN特征
   它的速度很慢,因为它依赖于选择性搜索

SPPNet

SPPNet(https://arxiv.org/abs/1406.4729)引入了一种新的层来弥补RCNN体系结构的一些问题:空间金字塔池化(SPP)层。这一层接受可变大小的输入,并创建固定大小的输入。

考虑一个具有1x1, 2x2, 2x3和4x4分割的4级SPP层的例子,给这个层提供一个2D数组。这个数组将使用这些拆分中的每一个进行池化,创建一个维度为1x1 + 2x2 + 2x3 + 4x4 = 27的向量。无论输入图像的分辨率是多少,输出矢量都是27x1矢量。

SPPNet也采用了与RCNN不同的方法,它重用了CNN的特征。事实上,不是输入裁剪后的输入图像,而是将整个图像输入CNN,并使用选择性搜索区域来裁剪最终的特征图。然后将这些区域送入SPP层。通过这样做,SPPNet获得了与RCNN相似的性能,同时将推断时间提高了近100倍。

 3.基于区域CNNs (RCNNs)II

Fast-RCNN

Fast RCNN(https://arxiv.org/pdf/1504.08083.pdf)在RCNN和SPPNet的基础上进行了改进,采用了多任务损失端到端训练的方法,即对目标的分类和边界框的回归都使用单个损失函数。因此,可以将模型训练作为单个实体,而不必分别训练不同的模块。该模型还使用了感兴趣区域(ROI)池化,一个1级SPP层。

Faster-RCNN

Faster RCNN架构(https://arxiv.org/pdf/1506.01497.pdf)是RCNN家族的最新迭代。

它比RCNN和FastRCNN更好,不再依赖于选择性搜索。相反,它使用区域提议网络(Region Proposal Network, RPN)来生成ROIs。RPN使用最后一个卷积层的特征映射来生成ROIs。RPN在特征图上使用一个滑动窗口,对于该窗口的每个位置,生成k个锚框。这些锚框用于确定该区域是否包含目标。

由于采用了多任务损失函数,FasterRCNN的所有组件都是同时训练的。

4.单段式目标检测

You Only Look Once (YOLO)采取了与FasterRCNN非常不同的方法。这篇2016年论文(https://arxiv.org/pdf/1506.02640.pdf的作者没有依赖于区域提议步骤,而是直接将输入图像分割成网格。对于网格的每个元素,网络预测B个边界框和目标得分。

通过摆脱区域提议步骤,YOLO提供了比FasterRCNN更快的推理时间。

作者又发布了两个版本的YOLO。这里描述了最新的YOLOv3(https://pjreddie.com/media/files/papers/YOLOv3.pdf。此外,其他研究人员还发布了YOLOv4(https://arxiv.org/pdf/2004.10934.pdfYOLOv5(GitHub - ultralytics/yolov5: YOLOv5

图像中的目标检测学习笔记(一)相关推荐

  1. 《南溪的目标检测学习笔记》——模型预处理的学习笔记

    1 介绍 在目标检测任务中,模型预处理分为两个步骤: 图像预处理:基于图像处理算法 数值预处理:基于机器学习理论 关于图像预处理,请参考<南溪的目标检测学习笔记>--图像预处理的学习笔记 ...

  2. 《南溪的目标检测学习笔记》——COCO数据集的学习笔记

    1 COCO数据集 COCO数据集下载链接:COCO_download 1.1 数据概览 数据集大小 train: 118287张 train+val: 123287张 val: 5000张 目标数量 ...

  3. 《南溪的目标检测学习笔记》——夏侯南溪的CNN调参笔记,加油

    1 致谢 感谢赵老师的教导! 感谢张老师的指导! 2 调参目标 在COCO数据集上获得mAP>=10.0的模型,现在PaddleDetection上的Anchor-Free模型[TTFNet]的 ...

  4. [初窥目标检测]——《目标检测学习笔记(2):浅析Selective Search论文——“Selective Search for object recognition”》

    [初窥目标检测]--<目标检测学习笔记(2):浅析Selective Search论文--Selective Search for object recognition> 本文介绍 前文我 ...

  5. 9月1日目标检测学习笔记——文本检测

    文章目录 前言 一.类型 1.Top-Down 2.Bottom-up 二.基于深度学习的文本检测模型 1.CTPN 2.RRPN 3.FTSN 4.DMPNet 5.EAST 6.SegLink 7 ...

  6. 《南溪的目标检测学习笔记》的笔记目录

    1 前言 这是<南溪的目标检测学习笔记>的目录~ 2 学习目标检测的思路--"总纲" <南溪的目标检测学习笔记>--目标检测的学习笔记 我在这篇文章中介绍了 ...

  7. 《南溪的目标检测学习笔记》——目标检测模型的设计笔记

    1 南溪学习的目标检测模型--DETR 南溪最赞赏的目标检测模型是DETR, 论文名称:End-to-End Object Detection with Transformers 1.2 decode ...

  8. 3D目标检测学习笔记

    博主初学3D目标检测,此前没有相关学习背景,小白一枚-现阶段的学习重点是点云相关的3D检测. 本文是阅读文章:3D Object Detection for Autonomous Driving: A ...

  9. X射线图像中的目标检测

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 1 动机和背景 每天有数百万人乘坐地铁.民航飞机等公共交通工具,因 ...

最新文章

  1. open(/dev/ietctl, O_RDWR) 参数含义
  2. 链路聚合(Link Aggregation)与权重
  3. Spring4.1新特性——Spring MVC增强
  4. 为什么我的电脑输入法的图标和原来的活动窗口离得那么远
  5. 26个LinkedList用法示例大全以及与ArrayList/数组的相互转换
  6. c语言将0到1十等分放入数组,C语言课程设题计目汇总.doc
  7. idea生成方法注释的正确方法
  8. Ozon Tech Challenge 2020 (Div.1 + Div.2) E.Kuroni and the Score Distribution 构造
  9. Aiseesoft Screen Recorder入门教程
  10. 三万字带你了解那些年面过的Java八股文
  11. TCPIP详解3.8ifconfig
  12. STC15单片机-LED闪烁(定时器)
  13. golang的优劣与前景分析
  14. 烤地瓜(PYTHON 学习类和对象)
  15. Codeforces Round #116 C.Letter
  16. 寒武纪MLU270 平台 CNStream 学习记录
  17. isEmpty与null的区别
  18. java中的mybatis作用_mybatis作用、基本使用、小结
  19. 天选2出现找不到wlan问题
  20. 用户登录验证最多3次java_实现用户注册、登录、幸运抽奖功能,验证次数最多3次...

热门文章

  1. Mysql 出现Error 1118 Row size too large. The maximum row size is 65535 的解决办法
  2. 帧融合的功能(慢镜头的制作)
  3. BZOJ1024 SCOI2009生日快乐
  4. html教程自适应,html自适应界面
  5. 受伤的皇后(超详细)--蓝桥杯真题DFS
  6. 「容器云」k0s 另外一个 Kubernetes 发行版
  7. 现在的编辑器不能复制粘贴word中的文本
  8. 小程序存入手机号码到通讯录
  9. 【VUE】前端传入id却显示id对应的名称
  10. 软件测试方法之场景法详解及实战