参考论文《Histograms of Oriented Gradients for Human Detection》

花了一天多的时间,整理了一下HOG特征。接下来就HOG特征进行一些解释:

  1. HOG含义
  2. HOG具体计算
  3. HOG源码

一、HOG含义

在参考论文中,作者设计了一种方向梯度直方图(Histograms of Oriented Gradient,HOG)对行人进行检测,它通过计算局部区域的梯度方向并进行统计来作为该局部区域的特征。

二、HOG具体计算

2.1 Gamma Normalization

为了减少光照因素的影响,首先需要将整个图像进行正则化。实验证明,对每个颜色通道进行平方根gamma压缩(即gamma参数为0.5)时有较高的性能提升。gamma正则化公式如下:

其中H(x,y)表示像素点(x,y)的像素值。

2.2 Gradient Computation

计算图像横坐标和纵坐标方向的梯度,并据此每个像素位置的梯度方向。计算不同的梯度计算方法对于检测器性能有很大影响。作者在对图像进行高斯平滑后,测试了不同的梯度计算方法,包括一维模板[-1,1]、[-1,0,1]、[1,-8,0,8,-1]等,最终选择使用[-1,0,1]计算水平方向梯度,用其转置计算垂直方向梯度。

因此图像中像素点(x,y)的梯度为:

公式中Gx(x,y)表示像素点(x,y)的水平方向梯度,Gy(x,y)表示像素点(x,y)的垂直方向梯度。

通过Gx(x,y)和Gy(x,y)计算该像素点的梯度大小和方向:

公式中G(x,y)为梯度大小,θ(x,y)为梯度方向。

2.3 Spatial / Orientation Binning

统计局部图像梯度信息并进行量化,得到局部图像的特征描述向量。这能够较好的保持对图像中人体对象的姿势和外观的鲁棒性。

局部图像的单位是Cell,大小为8*8。假设采用9个bin来统计一个cell中的梯度信息,即将360度的梯度方向分成9个方向,如图所示:

量化的公式如下:

计算cell内每个像素的梯度,为某个基于方向的bin投票(vote),从而形成方向梯度直方图。细胞单元可以是矩形的或者环形(极坐标中的扇形)的。直方图的方向bin在0度-180度(无符号梯度)或者0度-360度(有符号梯度)之间均分。为了减少混叠现象,梯度投票在相邻bin的中心之间需要进行方向和位置上的双线性插值。投票的权重根据梯度幅值进行计算,可以取幅值本身、幅值的平方或者幅值的平方根。作者通过实验表明,使用梯度本身作为投票权重效果最好。

梯度信息具体统计举例参考了这篇博客。https://blog.csdn.net/u011665459/article/details/60575107

以博尔特头顶的8*8像素大小的cell为例,通过前两步的计算可以得到每个像素的梯度幅值和梯度方向。

接下来在8×8的cell中创建一个9-bins的直方图。在蓝色圈所在像素的梯度方向是80度,幅值为2,所以在bin为80的格子里面加2。在红色圈所在像素的梯度方向为10度,幅值为4,但是bin中没有10这个值,只有0和20,所以把4平均分配到bin为0和20的格子中。

还有一点需要注意到的如果某个像素的方向超过了160,由于直方图是首尾相连的(即180就是0),因此我们把像素值按比例(根据像素的角度距离边界远近)分配到0和160的格子中,如下图。

通过对cell中所有像素点进行统计得到以下方向梯度直方图。

2.4  Block Normalization

由于局部光照的变化,以及前景背景对比度的变化,使得梯度强度的变化范围非常大。比如说,当图像值全部减少了一倍,那么梯度值也为减少一倍,但是我们不希望图像值影响到梯度值,所以需要对梯度做局部对比度归一化。

假设一个 RGB 颜色向量为 [ 128,64,32],它的长度为146.64,这个值是用L2范数公式来计算的。接着让颜色向量同时除以长度(即归一化)得到标准化向量[0.87, 0.43, 0.22]。如果此时将颜色向量值扩大两倍即2 x [ 128, 64, 32 ] = [ 256, 128, 64 ],我们按同样方法计算标准化向量得到的依旧是[0.87, 0.43, 0.22]。 因此归一化能够使得梯度幅值不受到图像像素值变化的影响。

在论文中,作者测试了多种不同的归一化策略,大多数都是将细胞单元组成更大的空间块(block),然后针对每个块进行对比度归一化。最终的描述子是检测窗口内所有块内的细胞单元的直方图构成的向量。事实上,块之间是有重叠的,也就是说,每个细胞单元的直方图都会被多次用于最终的描述子的计算。

以下是VLFEAT库中关于HOG特征的Block Normalization的C++实现。具体算法是将cell5在cell1245、2356、4578、5689上分别进行正则化,再将正则化后的结果做0.2的截断处理,从而最终得到一个size为4*9的HOG特征。

/*HOG block-normalisation.The Dalal-Triggs implementation computes a normalized descriptor foreach block of 2x2 cells, by stacking the histograms of each cellinto a vector and L2-normalizing and truncating the result.Each block-level descriptor is then decomposed back into cellsand corresponding parts are stacked into cell-level descritpors.Each HOG cell is contained in exactlyfour 2x2 cell blocks. For example, the cell number 5 in the followingfigure is contained in blocks 1245, 2356, 4578, 5689:+---+---+---+| 1 | 2 | 3 |+---+---+---+| 4 | 5 | 6 |+---+---+---+| 7 | 8 | 9 |+---+---+---+Hence, when block-level descriptors are decomposed backinto cells, each cell receives contributions from four blocks. So,if each cell started with a D-dimensional histogram, itends up with a 4D dimesional descriptor vector.
*/
{float const * iter = self->hog ;for (y = 0 ; y < (signed)self->hogHeight ; ++y) {for (x = 0 ; x < (signed)self->hogWidth ; ++x) {/* norm of upper-left, upper-right, ... cells */vl_index xm = VL_MAX(x - 1, 0) ;vl_index xp = VL_MIN(x + 1, (signed)self->hogWidth - 1) ;vl_index ym = VL_MAX(y - 1, 0) ;vl_index yp = VL_MIN(y + 1, (signed)self->hogHeight - 1) ;double norm1 = atNorm(xm,ym) ;double norm2 = atNorm(x,ym) ;double norm3 = atNorm(xp,ym) ;double norm4 = atNorm(xm,y) ;double norm5 = atNorm(x,y) ;double norm6 = atNorm(xp,y) ;double norm7 = atNorm(xm,yp) ;double norm8 = atNorm(x,yp) ;double norm9 = atNorm(xp,yp) ;double factor1, factor2, factor3, factor4 ;factor1 = 1.0 / VL_MAX(sqrt(norm1 + norm2 + norm4 + norm5), 1e-10) ;factor2 = 1.0 / VL_MAX(sqrt(norm2 + norm3 + norm5 + norm6), 1e-10) ;factor3 = 1.0 / VL_MAX(sqrt(norm4 + norm5 + norm7 + norm8), 1e-10) ;factor4 = 1.0 / VL_MAX(sqrt(norm5 + norm6 + norm8 + norm9), 1e-10) ;float * oiter = features + x + self->hogWidth * y ;for (k = 0 ; k < self->numOrientations ; ++k) {double ha = iter[hogStride * k] ;double hb = iter[hogStride * (k + self->numOrientations)] ;double hc ;double ha1 = factor1 * ha ;double ha2 = factor2 * ha ;double ha3 = factor3 * ha ;double ha4 = factor4 * ha ;double hb1 = factor1 * hb ;double hb2 = factor2 * hb ;double hb3 = factor3 * hb ;double hb4 = factor4 * hb ;double hc1 = ha1 + hb1 ;double hc2 = ha2 + hb2 ;double hc3 = ha3 + hb3 ;double hc4 = ha4 + hb4 ;// jieduanha1 = VL_MIN(0.2, ha1) ;ha2 = VL_MIN(0.2, ha2) ;ha3 = VL_MIN(0.2, ha3) ;ha4 = VL_MIN(0.2, ha4) ;hb1 = VL_MIN(0.2, hb1) ;hb2 = VL_MIN(0.2, hb2) ;hb3 = VL_MIN(0.2, hb3) ;hb4 = VL_MIN(0.2, hb4) ;hc1 = VL_MIN(0.2, hc1) ;hc2 = VL_MIN(0.2, hc2) ;hc3 = VL_MIN(0.2, hc3) ;hc4 = VL_MIN(0.2, hc4) ;*oiter = hc1 ;*(oiter + hogStride * self->numOrientations) = hc2 ;*(oiter + 2 * hogStride * self->numOrientations) = hc3 ;*(oiter + 3 * hogStride * self->numOrientations) = hc4 ;oiter += hogStride ;} /* next orientation */++iter ;} /* next x */} /* next y */} /* block normalization */

HOG特征详解:Histograms of Oriented Gradients for Human Detection相关推荐

  1. 行人检测:论文翻译Histograms of Oriented Gradients for Human Detection

                                                                                       用于人体检测的方向梯度直方图 Na ...

  2. 梯度方向直方图和物体检测Histogram of Oriented Gradients and Object Detection

    If you've been paying attention to my Twitter account lately, you've probably noticed one or twoteas ...

  3. Histograms of Oriented Gradients (HOG)理解和源码

    HOG descriptors 是应用在计算机视觉和图像处理领域,用于目标检测的特征描述器.这项技术是用来计算局部图像梯度的方向信息的统计值.这种方法跟边缘方向直方图(edge orientation ...

  4. Brook_icv《SIFT特征详解》难点的辅助阅读内容

    在我学习SIFT时,遇到了我认为整理得最好的一篇文章Brook_icv<SIFT特征详解>.作者文字严谨,阅读略带美感,让人舒服,以致于我改变以前的写作方式,尝试一种新的方式,即以大牛的文 ...

  5. matlab intergral,matlab學習:人臉識別之HOG(Histograms of Oriented Gradients)

    HOG descriptors 是應用在計算機視覺和圖像處理領域,用於目標檢測的特征描述器.這項技術是用來計算局部圖像梯度的方向信息的統計值.這種方法跟邊緣方向直方圖(edge orientation ...

  6. matlab intergral,matlab学习:人脸识别之HOG(Histograms of Oriented Gradients)

    HOG descriptors 是应用在计算机视觉和图像处理领域,用于目标检测的特征描述器.这项技术是用来计算局部图像梯度的方向信息的统计值.这种方法跟边缘方向直方图(edge orientation ...

  7. 【Halcon】Region特征详解

    经过一系列图像处理操作之后,我们会发现可能会有大同小异的一些region.因此我们需要根据一些特征,来选择想指定的region. 1.求Region指定特征值:region_features(Regi ...

  8. JAVA面向对象三大特征详解:(封装,继承,多态)

    面向对象语言: 大家经常会听到说JAVA这门语言是面向对象的,但面向对象又是什么呢? 提到面向对象就要引入一个叫做面向过程的概念: 举个例子:把大象装进冰箱,需要几步. 面向过程的做法: 人走到冰箱前 ...

  9. java的三大特征详解

    **JAVA是什么: ** 面向对象的三大特征:封装,继承,多态 封装:就是把数据封装起来,让外界无法进行访问,一般用private修饰 用set和get方法进行属性的设置和获取 public cla ...

最新文章

  1. RGPNET: 复杂环境下实时通用语义分割网络
  2. 新年新气象,2008年是我创业关键的一年!
  3. 强化学习3——有模型(Model-base)与无模型(Model-free)RL的区别
  4. [react-router] React-Router 4的switch有什么用?
  5. dorado 7 怎么样_一点点奶茶怎么样?消费者眼中的网红奶茶
  6. Python3与OpenCV3.3 图像处理(一)--环境搭建与简单DEMO
  7. 所谓中央空调VRV指的是什么
  8. python shelve模块_python shelve模块
  9. DEL: 扁桃体发炎兼嗓子哑治疗药品
  10. 骨龄测试软件app_有哪些特别好用的 app 测试工具?
  11. 计算机通信子网的作用,通信子网
  12. B.FRIENDit壁虎忍者品牌故事
  13. 一篇彻底搞懂-->shell脚本
  14. 思维导图的优缺点与绘制思维导图方法
  15. linux 查看磁盘分区格式
  16. 12.静态路由、静态缺省路由
  17. Unity+高通Vuforia SDK——AR
  18. 雨伞16骨好还是24骨好_伞骨什么材质好 晴雨伞骨数越多越好吗
  19. android 系统的切图方式_android APPUI设计、切图的常用尺寸大全
  20. Object Detection in 20 Years A Survey 论文阅读笔记

热门文章

  1. 你的人生是这样的吗?
  2. open函数返回值为0
  3. 这个世界只有原子和虚空
  4. java计算机毕业设计花卉网站MyBatis+系统+LW文档+源码+调试部署
  5. HotSpot 启动流程
  6. 第四章 卡耐基怎样获取幸福 一 养成良好的习惯
  7. photoshop批量处理图片
  8. 深度学习 AI 美颜系列:AI 发型管家(美颜相机发型管家算法解析)
  9. 一个非计算机专业的 软考中级 软件设计师考试之路
  10. Latex学习及制作幻灯片