素材来源主要参考链接:https://blog.csdn.net/qq_37541097?spm=1001.2014.3001.5509

1.R-CNN综述

R-CNN 是两阶段的,相比一阶段而言,优点:精确,缺点:速度慢。本文主要针对作者的视频做个总结。


出自2010年作者Ross Girshick之手,

主要算法流程分为四个步骤
1.一张图像生成1K~2K个候选区域(使用Selective Search方法)
2.对每个候选的区域,使用深度网络提取特征
3.特征送入每一类的SVM分类器,判别是否属于该类
4.使用回归器修正候选框位置

2.步骤详解

2.1 候选框的选取

  • 利用ss算法通过图像分割得到一些原始的区域
  • 使用一些合并的策略将这些区域合并,得到一个层次化的区域结构‘
  • 这些结构可能会包含着可能需要的物体

2.2 单一候选区域,喂入CNN提取特征

  • 将原图像缩放到指定的尺寸(227*227pix),作为CNN的输入
  • 得到的矩阵展平变成一维的向量
  • 又因为是2000个候选的区域所以是2000x4096维矩阵
  • 作为下一个SVM分类器的输入

2.3 特征送入每一类的SVM分类器,判定类别

  • 将2000x4096的特征矩阵与20个SVM组成的权值矩阵4096x20相乘得到概率矩阵2000x20
  • 这个2000x20的概率矩阵的每一行代表建议框归于每一个目标的概率
  • 再针对2000x20的概率矩阵的每一列(代表的是每一类)进行非极大值抑制*剔除重叠的候选框,得到(该列)该类中得分最高的一些建议框

2.4 使用回归器修正候选框的位置

  • 得到的建议框,我们接着分别使用20个回归器对上述20个类别中剩余的建议框进行回归操作
  • 黄色框为建议框
  • 绿色表示实际框
  • 绿色表示回归后的预测框(最小二乘法解决回归问题)

3.缺点个问题

测试速度慢

训练速度慢

训练所需空间大

R-CNN简述(目标检测篇)相关推荐

  1. 【深度学习】一位算法工程师从30+场秋招面试中总结出的超强面经——目标检测篇(含答案)...

    作者丨灯会 来源丨极市平台 编辑丨极市平台 导读 作者灯会为21届中部985研究生,凭借自己整理的面经,去年在腾讯优图暑期实习,七月份将入职百度cv算法工程师.在去年灰飞烟灭的算法求职季中,经过30+ ...

  2. 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》

    深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...

  3. CV 面试问题详解宝典—目标检测篇

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨那年当上博士前 来源丨AI约读社 编辑丨极市平台 导读 面试知识点总结 序言 目标检测篇面试知识 ...

  4. 一位算法工程师从30+场秋招面试中总结出的超强面经——目标检测篇(含答案)

    作者丨灯会 来源丨极市平台 编辑丨极市平台 本文为极市平台原创,转载须经授权并注明来源 作者灯会为21届中部985研究生,七月份将入职某互联网大厂cv算法工程师.在去年灰飞烟灭的算法求职季中,经过几十 ...

  5. 深度学习论文阅读目标检测篇(四)中英文对照版:YOLOv1《 You Only Look Once: Unified, Real-Time Object Detection》

    深度学习论文阅读目标检测篇(四)中英文对照版:YOLOv1< You Only Look Once: Unified, Real-Time Object Detection> Abstra ...

  6. 深度学习论文阅读目标检测篇(一):R-CNN《Rich feature hierarchies for accurate object detection and semantic...》

    深度学习论文阅读目标检测篇(一):R-CNN<Rich feature hierarchies for accurate object detection and semantic segmen ...

  7. 深度学习论文阅读目标检测篇(七)中英对照版:YOLOv4《Optimal Speed and Accuracy of Object Detection》

    深度学习论文阅读目标检测篇(七)中英对照版:YOLOv4<Optimal Speed and Accuracy of Object Detection> Abstract 摘要 1. In ...

  8. 深度学习论文阅读目标检测篇(四)中文版:YOLOv1《 You Only Look Once: Unified, Real-Time Object Detection》

    深度学习论文阅读目标检测篇(四)中文版:YOLOv1<YouOnlyLookOnce:Unified,Real-TimeObjectDetection> 摘要 1.引言 2. 统一的检测 ...

  9. 深度学习论文阅读目标检测篇(二):Fast R-CNN《Fast R-CNN》

    深度学习论文阅读目标检测篇(二):Fast R-CNN<Fast R-CNN> Abstract 摘要 1. Introduction 引言 1.1 RCNN and SPPnet 1.2 ...

  10. OpenCV使用CNN进行目标检测

    OpenCV使用CNN进行目标检测 使用CNN进行目标检测 建造Building 物体检测 改变门槛 影像分类 使用CNN进行目标检测 建造Building 构建" dnn_objectec ...

最新文章

  1. linux 推荐硬件配置,2012最受欢迎的Linux用户硬件配置
  2. 常见数字IC设计、FPGA工程师面试题
  3. Druid(准)实时分析统计数据库——列存储+高效压缩
  4. zoj-3624(Count Path Pair)组合数+乘法逆元
  5. 10 行代码构建常见目标检测应用
  6. RegOpenKeyEx返回 2及原因
  7. 机器学习——KNN及代码实现
  8. VirtualBox没有64位选项,无法安装64位的解决方法(zhuan)
  9. 从事三年java开发后, 我打算转人工智能
  10. 【收藏向】模拟电子技术超强知识点总结 20小时不挂科
  11. excle批量填充自增数据
  12. word2010设置护眼背景
  13. 计算机网络协议教案反思,《TCP/IP协议分析》教学实践与反思
  14. 你还记得大明湖畔的“测试策略”么
  15. 宝塔自助建站程序源码 网站建设公司必备程序
  16. 关于函数凹凸性两种定义与二阶导数符号之间的联系证明
  17. java indexeddb_HTML5之IndexedDB使用详解
  18. html中visibility属性,(CSS) 不同浏览器对table中visibility属性显示的不同
  19. win10 引导系统损坏 和 bios设置
  20. VUE+THREEJS 创建完整会议室三维模型

热门文章

  1. oracle一个表空间超出32g,Oracle表空间超出32G的解决方法
  2. #萌新日志#4.使用Python定时发送微信消息
  3. Urho2D和 Physics2D
  4. AutoCAD2018错误提示:“许可管理器不起作用或未正确安装”的解决办法
  5. 计算机交互媒体应用范围,交互媒体
  6. 翻转课堂倒底翻转的是什么?
  7. 日常记账后,项目图表显示各种收支类别
  8. DLIA视觉缺陷检测平台——电子元器件焊点缺陷检测
  9. Android产品研发(二十)--代码Review
  10. 斑马线及让行的变迁与启示