深度学习-SSD算法
文章目录
- 一、SSD网络结构
- 算法细节
详细解析: https://blog.csdn.net/ytusdc/article/details/86577939
一、SSD网络结构
图1 SSD网络架构(精简版)
图2 SSD网络架构(细节版)
图3 VGG16网络架构
输入图像必须为300x300的,之后进入VGG16Conv5_3之前的全部网络结构
SSD采用VGG16作为基础模型,并且做了以下修改,如图1所示
- 分别将VGG16的全连接层FC6和FC7转换成 3x3 的卷积层 Conv6和 1x1 的卷积层Conv7
- 去掉所有的Dropout层和FC8层
- 同时将池化层pool5由原来的 stride=2 的 2x2 变成stride=1的 3x3 (猜想是不想reduce特征图大小)
- 添加了Atrous算法(hole算法),目的获得更加密集的得分映射
- 然后在VGG16的基础上新增了卷积层来获得更多的特征图以用于检测
算法细节
1、多尺度特征映射
图4 单层feature map预测和多层特征金字塔预测对比
如图4所示,左边的方法针对输入的图片获取不同尺度的特征映射,但是在预测阶段仅仅使用了最后一层的特征映射;而SSD(右图)不仅获得不同尺度的特征映射,同时在不同的特征映射上面进行预测,它在增加运算量的同时可能会提高检测的精度,因为它具有更多的可能性。
图5 SSD与Faster-rcnn比较
预测的过程
c表示识别多少个类别,一个default boxs有c个类别加上一个背景识别,有背景得分和物体识别得分。4表示边界框回归参数(x,y,w,h)
Faster RCNN存在的问题
- 对小目标检测效果很差
- 模型大,检测速度较慢
如图5所示,对于BB(bounding boxes)的生成,Faster-rcnn和SSD有不同的策略,但是都是为了同一个目的,产生不同尺度,不同形状的BB,用来检测物体。对于Faster-rcnn而言,其在特定层的Feature map上面的每一点生成9个预定义好的BB,然后进行回归和分类操作来进行初步检测,然后进行ROI Pooling和检测获得相应的BB;而SSD则在不同的特征层的feature map上的每个点同时获取6个(有的层是4个)不同的BB,然后将这些BB结合起来,最后经过NMS处理获得最后的BB。
深度学习-SSD算法相关推荐
- 深度学习 -- SSD 算法流程详解
SSD同样是经典论文,后续很多论文以此为基础,所以搞懂流程比较重要,中间如果 有写的不对.有问题或者有看不懂的地方,还望指正.如果有了新的理解,我会持续更新. 作为经典论文,SSD算法也同样产生了很多 ...
- 模块一:深度学习入门算法
模块一:深度学习入门算法 1.深度学习必备知识 1.1深度学习要解决的问题 机器学习流程: 数据获取 -----> 特征工程 -----> 建立模型 ------> 评估与应用 特征 ...
- Adam 那么棒,为什么还对 SGD 念念不忘?一个框架看懂深度学习优化算法
作者|Juliuszh 链接 | https://zhuanlan.zhihu.com/juliuszh 本文仅作学术分享,若侵权,请联系后台删文处理 机器学习界有一群炼丹师,他们每天的日常是: 拿来 ...
- 近期活动盘点:心电数据标注系统和深度学习诊断算法研究、2019年第六届清华大学大数据社会科学讲习班...
想知道近期有什么最新活动?大数点为你整理的近期活动信息在此: 第四期医工结合研讨会:心电数据标注系统和深度学习诊断算法研究 2019年7月11日 7月11日,"医工结合系列研讨会第四期会议: ...
- 谷歌发布深度学习新算法,适用于真实机器人的技能学习
https://www.toutiao.com/a6649215346496504327/ 2019-01-22 15:11:28 通过这种名叫SAC(柔性致动/评价)的强化学习算法,机器人能很快地完 ...
- 2017年深度学习优化算法最新进展:改进SGD和Adam方法
2017年深度学习优化算法最新进展:如何改进SGD和Adam方法 转载的文章,把个人觉得比较好的摘录了一下 AMSGrad 这个前期比sgd快,不能收敛到最优. sgdr 余弦退火的方案比较好 最近的 ...
- 2017年深度学习优化算法最新进展:如何改进SGD和Adam方法?
2017年深度学习优化算法最新进展:如何改进SGD和Adam方法? 深度学习的基本目标,就是寻找一个泛化能力强的最小值,模型的快速性和可靠性也是一个加分点. 随机梯度下降(SGD)方法是1951年由R ...
- Pytorch框架的深度学习优化算法集(优化中的挑战)
个人简介:CSDN百万访问量博主,普普通通男大学生,深度学习算法.医学图像处理专攻,偶尔也搞全栈开发,没事就写文章,you feel me? 博客地址:lixiang.blog.csdn.net Py ...
- 深度学习新算法,完成字里行间的情绪识别
深度学习新算法,完成字里行间的情绪识别 发表于2013-10-12 11:41| 40891次阅读| 来源Wired| 68 条评论| 作者Daniela Hernandez 深度学习人工智能机器学习 ...
最新文章
- 增加了一行代码,让我们提高了 3000% 的性能
- 计算机网络第六版 重点,计算机网络第六版重点习题及答案.docx
- kibana操作elasticsearch:查看索引库数据
- python中readlines_python中read() readline()以及readlines()用法
- 原来MySQL面试还会问这些...
- bzoj2756 [SCOI2012]奇怪的游戏 结论+网络流
- RestTemplate异常no suitable HttpMessageConverter found for request type [java.lang.Integer]
- 职场这样发邮件,你死定了!
- http服务详解(2)——httpd2.2的配置文件常见设置
- IT服务管理流程控制主要绩效指标有哪些?
- u盘如何安装xp和linux,怎样从U盘安装Windows XP?
- 抖音,新的流量洼地?
- watchfit会升级鸿蒙么,要点曝光:华为watchfit活力版质量好吗?主要的优势在哪里?...
- 网络在线直播技术揭秘(一):编码与压缩算法
- Tableau数据分析笔记-Chapter06填充地图、多维地图、混合地图
- 【SDOI2009】【BZOJ1227】虔诚的墓主人
- deepin-wine
- stm32时钟问题简单介绍
- hbase安装启动成功,但是执行命令报错
- java.util.Date java.sql.Date