1 致谢

感谢赵老师的讲授。

2 前言

FaceBoxes是一种用来进行人脸检测的算法框架,我个人感觉还是比较好的,吸收了SSD的一些优点。

3 FaceBoxes的论文阅读

3.3. Anchor densification strategy

在3.3节中,论文主要讲到了,锚点致密化策略,

在阅读时,我看到一个概念不太清楚,

这部分文字说到,对于Conv3_2卷积层,这里的 stride size为64像素,这里我不太明白 stride size的含义,其实,它指的是不同锚点之间相距的步长,我把它称作锚间步长,其大小跟当前卷积层的 feature map的大小相关,还是以Conv3_2卷积层为例,其输出 feature map的大小为16x16,则对于特征图中的每一个像素点,与其相邻像素点对应的感受野的中心的距离,即为输入图像1024/16 = 64,即两个相邻感受野的步长间距,同时也是两个相邻锚的间距;

3.4 Loss函数

回归任务采用的是 smooth L1L_1L1​ loss函数,其公式为:
smoothL1(x)={0.5x2if∣x∣<1∣x∣−0.5otherwisesmooth_{L_1}(x)= \left\{\begin{matrix} 0.5x^2 & \text{if} \left | x \right | < 1\\ \left | x\right |-0.5 & \text{otherwise}\\ \end{matrix}\right. smoothL1​​(x)={0.5x2∣x∣−0.5​if∣x∣<1otherwise​

4 FaceBoxes的代码学习

4.1 网络架构

Inception模块需要自己定义,PyTorch没有提供Inception模块的封装类;

4.2 模型训练

FaceBoxes仅支持1024x1024图片的训练;

4.3 补充资料

4.3.1 cfg配置参数

steps:描述了三个输出模块的特征图的步长。

这里三个输出模块是指:Inception3、Conv3_2和Conv4_2三个模块;

steps的三个值32, 64, 128是跟网络结构有关的,根据网络结构计算出来的;
3.2.1 encode操作

encode是SSD中提出的一种特殊操作。

FaceBoxes的学习笔记相关推荐

  1. Python中索引的学习笔记

    1 前言 今天在学习FaceBoxes- 看到一个比较奇怪的代码,"order = scores.argsort()[::-1][:args.top_k]",不太懂这个" ...

  2. 学习笔记:深度学习(3)——卷积神经网络(CNN)理论篇

    学习时间:2022.04.10~2022.04.12 文章目录 3. 卷积神经网络CNN 3.1 卷积神经网络的概念 3.1.1 什么是CNN? 3.1.2 为什么要用CNN? 3.1.3 人类的视觉 ...

  3. PyTorch 学习笔记(六):PyTorch hook 和关于 PyTorch backward 过程的理解 call

    您的位置 首页 PyTorch 学习笔记系列 PyTorch 学习笔记(六):PyTorch hook 和关于 PyTorch backward 过程的理解 发布: 2017年8月4日 7,195阅读 ...

  4. 容器云原生DevOps学习笔记——第三期:从零搭建CI/CD系统标准化交付流程

    暑期实习期间,所在的技术中台-效能研发团队规划设计并结合公司开源协同实现符合DevOps理念的研发工具平台,实现研发过程自动化.标准化: 实习期间对DevOps的理解一直懵懵懂懂,最近观看了阿里专家带 ...

  5. 容器云原生DevOps学习笔记——第二期:如何快速高质量的应用容器化迁移

    暑期实习期间,所在的技术中台-效能研发团队规划设计并结合公司开源协同实现符合DevOps理念的研发工具平台,实现研发过程自动化.标准化: 实习期间对DevOps的理解一直懵懵懂懂,最近观看了阿里专家带 ...

  6. 2020年Yann Lecun深度学习笔记(下)

    2020年Yann Lecun深度学习笔记(下)

  7. 2020年Yann Lecun深度学习笔记(上)

    2020年Yann Lecun深度学习笔记(上)

  8. 知识图谱学习笔记(1)

    知识图谱学习笔记第一部分,包含RDF介绍,以及Jena RDF API使用 知识图谱的基石:RDF RDF(Resource Description Framework),即资源描述框架,其本质是一个 ...

  9. 计算机基础知识第十讲,计算机文化基础(第十讲)学习笔记

    计算机文化基础(第十讲)学习笔记 采样和量化PictureElement Pixel(像素)(链接: 采样的实质就是要用多少点(这个点我们叫像素)来描述一张图像,比如,一幅420x570的图像,就表示 ...

最新文章

  1. VMware学习使用笔记
  2. oracle 查询关键字,Oracle 中的SELECT 关键字(查询、检索)
  3. python 使用标准库连接linux实现scp和执行命令
  4. 学python第二天_学习Python的第二天
  5. pythoncount函数怎么用_python中count函数简单的实例讲解
  6. 男人在35岁之前最好的投资
  7. supervisor进程守护
  8. 效率:标记语言:markdown
  9. Ubuntu16.0.4 通过Docker安装酷Q
  10. 如何制作音乐界面动效设计
  11. Android 开机第一帧制作、开关机动画制作、壁纸添加
  12. 智慧灯杆解决方案之智慧景区(园区)建设
  13. 番茄ToDo帮助文档
  14. 新闻接口调用之新浪滚动新闻
  15. Galaxy数据统计平台(一)
  16. linux wifi6,WIFI6 基本知识(一)
  17. 美国国土安全部2.5万雇员隐私信息遭黑客窃取
  18. java ice开发_ice开发流程(一)
  19. 散阅史记_老子韩非列传第三
  20. 百度名词~杂篇--(对日常遇到事物的深入了解)

热门文章

  1. vue Class 与 Style 绑定
  2. 操作日志的设计小结by大熊
  3. iOS常用的忽略警告
  4. IE10、IE11解决不能播放Flash的问题!
  5. 获取本机外网ip地址
  6. 利用脚本启动java程序
  7. Android平台下基于XMPP的IM研究
  8. 我搭建Wiki网站的步骤
  9. 【matplotlib笔记】柱形图、直方图、散点图、饼图以及叠加图绘制
  10. 谁动过你的电脑?小姐姐们要学会保护好自己电脑里的小秘密呀