一、CNN based One-Stage Detectors

所有论文综述均保持如下格式:
1、一页PPT内容总结一篇论文
2、标题格式一致:出处 年份 《标题》
3、内容格式一致:针对XX问题;提出了XX方法;本文证明了XXX
4、把握核心创新点,言简意赅
5、开源代码链接

强烈推荐:目标检测论文资源列表(各目标检测网络性能对比、论文链接、官方/非官方代码链接)
https://github.com/hoya012/deep_learning_object_detection#2014

一、ICLR 2014《Over Feat:Integrated Recognition, Localization and Detection using Convolutional Networks》
  • 针对:分类任务中,卷积神经网络的特征提取用于定位检测
  • 提出了:利用滑窗和规则块生成候选框,再利用多尺度滑窗增加检测结果,解决图像目标形状复杂、尺寸不一,最后用CNN、回归模型分类、定位目标
  • 本文证明了:首次提出用同一卷积网络完成多个任务(分类、定位、检测)把分类过程提取到的特征同时用于定位检测,只需要改变网络的最后几层即可
二、CVPR 2016《You Only Look Once: Unified, Real-Time Object Detection》v1
  • 针对:Two-stage目标检测速度问题
  • 提出了:第一个one-stage检测器;完全放弃“proposal detection + verification”;将单个神经网络应用于完整图像,将图像划分为多个区域,并同时预测每个区域的边界框和概率;采用Leaky ReLU


    缺点:与two-stage相比,定位精度下降,特别对于一些小目标,YOLO后续版本和SSD关注了该问题。
  • 本文证明了:YOLOv1能有效地提升目标检测速度
    GitHub官方源码
    GitHub非官方源码(Tensorflow)
三、CVPR 2017《YOLO9000: Better, Faster, Stronger》
  • 针对:检测速度和准确率之间的trade-off,重点解决召回率和定位精度的误差
  • 提出了:1.在每一卷积层后面加入BN;2.High resolution classifier;3.借鉴faster R-CNN,引入Anchor机制,通过预测Anchor box的偏移值与置信度,而不是直接预测坐标值;4.维度聚类(使用K-means聚类方法类训练Bounding Boxes,自动找到更好的宽高维度的值用于先验Anchor box);5.直接位置预测;6.Fine-Grained Features;7.特征融合(将高分辨率的浅层特征连接到高层进行特征融合,提高对小目标的检测能力);8.多尺度训练(训练网络时采用随机输入32倍数的图像尺寸,使网络能在不同分辨率上检测);9.采用Darknet-19主干网络
  • 本文证明了:YOLOv2能有效提升检测速度和精度;此外,通过目标分类与检测的联合训练方法,可以检测多达9000种物体
    GitHub非官方源码(PyTorch)
    GitHub非官方源码(Tensorflow)
四、CVPR 2018《YOLOv3: An Incremental Improvement》
  • 针对:保证实时性基础上追求高检测精度
  • 提出了:1. bounding box中只有和ground truth的IOU最大的bounding box才是用来预测该object;2.多标签分类,每个候选框可预测多个分类,将softmax换成逻辑回归层;3.多尺度预测,类似FPN;4.更好的基础分类网络darknet-53
  • 本文证明了:YOLO系列的最强版本
    GitHub非官方源码(PyTorch)
    GitHub非官方源码(Tensorflow)
五、ECCV 2016《SSD:Single Shot MultiBox Detector》
  • 针对:多尺度物体检测
  • 提出了:引入多参考和多分辨率检测技术,采用多尺度特征图做预测;采用卷积进行检测;设置先验框;SSD中的数据增广可以多学习
  • 本文证明了:该技术显著提高了one-stage的检测精度,尤其对于某些小物体
    GitHub非官方源码(PyTorch)
    GitHub非官方源码(Tensorflow)
六、ICCV 2017《RetinaNet:Focal Loss for Dense Object Detection》
  • 针对:One-stage检测精度不如two-stage,极端前景-背景(正负样本)类别不均衡导致
  • 提出了:交叉熵损失基础上,提出focal loss(只能说非常好用!),以便检测器在训练过程中将更多的注意力放在困难、分类错误的示例上
  • 本文证明了:Focal Loss使one-stage达到two-stage相当的精度,同时保持非常高的检测速度
    GitHub非官方源码(PyTorch)
    GitHub非官方源码(Tensorflow)

二、说明

  • 博客内容只是总结每篇论文的主要创新点,针对什么问题,提出了什么方法,没有翻译论文,也没有详细阐述论文中提出的网络结构,实验方法。原因在于:网上有很多关于各种论文的详细翻译、理解,但读者很难集中时间去消化理解每一篇论文内容,往往都是看完一篇过几天就忘记了,所以本文采用这种总结方式,简洁明了,使其对基于One-stage的目标检测网络有一整体的认识。
  • 以上内容均基于本人看论文的理解,可能在某些总结上存在错误或者理解不够,恳请大家能在留言提出来,我会及时修改,我希望通过写博客的方式,加深对论文的理解,并期望得到提高,谢谢大家!

目标检测论文综述(三)One-Stage(YOLO系列)相关推荐

  1. 目标检测论文综述(四)Anchor-Free

    --CNN based Anchor-Free Detectors 所有论文综述均保持如下格式: 1.一页PPT内容总结一篇论文 2.标题格式一致:出处 年份 <标题> 3.内容格式一致: ...

  2. 基于深度学习的目标检测论文综述Paper Reading:A Survey of Deep Learning-based Object Detection(中文)

    摘要 介绍了文章的大致思路和结构: 1.介绍,经典的目标检测算法,数据集 2.分析比对,各种目标检测算法,包括一阶段和两阶段的 3.介绍,传统和新的应用,以及一些目标检测的其他分支 4.讨论,用目前这 ...

  3. 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》

    深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...

  4. YOLO V1 实时的目标检测 论文翻译

    YOLO V1 实时的目标检测 论文翻译 注:学习记录用 摘要 我们提出了一种新的目标检测方法 YOLO.先前关于目标检测的工作重新使用分类器来执行检测. 相反,我们将目标检测框架作为一个回归问题,以 ...

  5. 一文总结旋转目标检测全面综述:论文方法与代码

    参考一文总结旋转目标检测全面综述:论文方法与代码 - 云+社区 - 腾讯云 首先放上DOTA数据集官网(http://captain.whu.edu.cn/DOTAweb/index.html),官网 ...

  6. 基于深度学习的目标检测算法综述(一)

    基于深度学习的目标检测算法综述(一) 基于深度学习的目标检测算法综述(二) 基于深度学习的目标检测算法综述(三) 本文内容原创,作者:美图云视觉技术部 检测团队,转载请注明出处 目标检测(Object ...

  7. 基于深度学习的目标检测算法综述(二)

    转自:https://zhuanlan.zhihu.com/p/40020809 基于深度学习的目标检测算法综述(一) 基于深度学习的目标检测算法综述(二) 基于深度学习的目标检测算法综述(三) 本文 ...

  8. 一文尽览 | 基于点云、多模态的3D目标检测算法综述!(Point/Voxel/Point-Voxel)

    点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心技术交流群 后台回复[ECCV2022]获取ECCV2022所有自动驾驶方向论文! 目前 ...

  9. 基于深度学习的目标检测研究综述

    基于深度学习的目标检测研究综述 摘要:深度学习是机器学习的一个研究领域,近年来受到越来越多的关注.最近几年,深度学习在目标检测领域取得了不少突破性的进展,已经运用到具体的目标检测任务上.本文首先详细介 ...

最新文章

  1. Tim Berners-Lee重新分散的新Web SOLID简介
  2. 特征工程 - 特征筛选
  3. (转)使.Net程序在未安装framework的电脑上运行(公布方法、源代码)
  4. mysql sql文件太大_MySQL导入的sql脚本文件过大解决方案
  5. 微软VS2008月底推出beta 2中文版 搭配.NET 3.5
  6. CNN中的权重维度解析以及卷积核中的数值是怎么确定的
  7. Java 13:文本块
  8. CRNN+CTCLoss中文手写汉字识别
  9. string 转 byte_计算机毕业设计中java实现在线预览poi实现word、excel、ppt转html
  10. 图的BFS和DFS原理及实例分析(java)
  11. 晶振旁的电阻(并联与串联)和电容的作用
  12. 5月6阴阳师服务器维护,《阴阳师》手游5月6日维护更新公告
  13. java中modifier_Ruby中的private modifier与Java中的对比
  14. [玩转北京] 北京最值得你一看的博物馆大全
  15. Unity3D占用内存太大怎么解决呢? -尾
  16. 【以太网通信】PHY 芯片回环测试
  17. Studing Day3 - python基础3
  18. 裁员之外,京东还在偷偷做这件事
  19. 【信息学奥赛一本通】1404:我家的门牌号
  20. 7-14 然后是几点(C语言)

热门文章

  1. Knife4j 2.0.8发布,史诗级微服务聚合文档中间件诞生
  2. ORA-00600: 内部错误代码, 参数: [kcratr_nab_less_than_odr]
  3. git常用命令的解释
  4. BCB 生成某个范围内的随机数
  5. ConcurrentHashMap扩容原理
  6. 【Dart 教程系列第 40 篇】Dart 之 trim,trimLeft,trimRight 字符串去除空格
  7. windows系统入侵排查思路
  8. 西工大博士计算机专业课,[考博复习资料]西北工业大学2018博士招生计算机辅助几何造型技术考试大纲_考博_旭晨教育...
  9. 《the Great Gatsby》Day 27
  10. BLOCK层代码分析(6)IO下发之SGL聚散列表