在样本数量比较少的情况下,可以采用HOG、SVM对样本进行初步的筛选出,正负样本,本文接着上一节二值化出来部分样本后,用pictureRelate做初步筛选出正负样本各500,准确训练。

1、pictureRelate使用http://www.walthelm.net/picture-relate/

   可以用来比较图片的相似程度,或找出类似的图片文件的图像处理工具。在同一个视窗里浏览不同文件夹和硬盘驱动器中的图片文件#支持查看,改名,删除,剪贴,拖动,切换至文件管理器等操作#可处理多达50000多张图片!支持JPG, BMP, PNG, TIFF, PPM, PGM, PBM, RAS等格式#可以通过导入过滤命令行读取任何其它格式。


这里HOG LBP特征可以采用VLfeat(http://www.vlfeat.org/)这个开源库里面的特征,或者用OpenCV里面的也可以,分类器SVM采用的是OpenCV里面的。

2、下面介绍下VLfeat里面的HOG特征

左图是原图,右图是HOG变化后的可视化效果。可以仔细对比,房子的轮廓还是可见的。

3、HOG+SVM训练目标检测的流程(OpenCV自带):

http://blog.csdn.net/carson2005/article/details/7841443

(1)准备训练样本集合;包括正样本集和负样本集;

(2)收集到足够的训练样本之后,你需要手动裁剪样本。例如,你想用Hog+SVM来对商业步行街的监控画面中进行行人检测,那么,你就应该用收集到的训练样本集合,手动裁剪画面中的行人(可以写个简单程序,只需要鼠标框选一下,就将框选区域保存下来--这一步在上一节有介绍)。

(3)裁剪得到训练样本之后,将所有正样本放在一个文件夹中;将所有负样本放在另一个文件夹中;并将所有训练样本缩放到同样的尺寸大小。本文是采用90*24的区域训练的。

(4)提取所有正样本的Hog特征;

(5)提取所有负样本的Hog特征;

(6)对所有正负样本赋予样本标签;例如,所有正样本标记为1,所有负样本标记为0;

(7)将正负样本的Hog特征,正负样本的标签,都输入到SVM中进行训练;Dalal在论文中考虑到速度问题,建议采用线性SVM进行训练。这里,不妨也采用线性SVM;

(8)SVM训练之后,将结果保存为文本文件。

(9)线性SVM进行训练之后得到的文本文件里面,有一个数组,叫做support vector,还有一个数组,叫做alpha,有一个浮点数,叫做rho;将alpha矩阵同support vector相乘,注意,alpha*supportVector,将得到一个列向量。之后,再该列向量的最后添加一个元素rho。如此,变得到了一个分类器,利用该分类器,直接替换opencv中行人检测默认的那个分类器(cv::HOGDescriptor::setSVMDetector()),就可以利用你的训练样本训练出来的分类器进行检测了。

效果显示:

欢迎交流,QQ:896922782,微信:15058133936

http://blog.csdn.net/zhubenfulovepoem/article/details/12343219


车牌识别技术详解五--采用LBP+HOG SVM做目标分类,车牌检测,字符检测等相关推荐

  1. 高帧率扑克牌识别技术详解一(可用于车牌识别,字符识别,人脸检测,验证码识别等等成熟领域)

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 高帧率扑 ...

  2. 车牌识别技术详解一(可用于车牌识别,字符识别,人脸检测,验证码识别等等成熟领域)

    本文主要介绍目前主流的adaboost目标检测算法,和CNN卷积神经网络字符识别算法.以扑克牌识别技术为题介绍相关的开发流程和经验. 整个系统包括, 1.摄像头采集,这里以USB摄像头通过direct ...

  3. 车牌识别与计算机编程,基于MATLAB的车牌识别程序详解.ppt

    基于MATLAB的车牌识别程序详解 自定义一个字符函数,用来从车牌区域中提取出7个字符,其中利用切割函数来进行切割. 程序:function [word,result]=getword(d) word ...

  4. 聊聊自动驾驶必须解决哪些感知问题?交通标志识别技术详解

    交通标志识别系统是智能交通系统与先进辅助驾驶系统的重要组成部分,由于道路交通较为复杂,提高交通检测与识别算法的准确率和实时性是走向实际应用进程中需要解决的关键问题. 算法的准确率是交通标志识别研究中一 ...

  5. Python+OpenCV人脸识别技术详解

    总在科幻电影里看到人脸识别,现在我们也可以编程来实现啦.哈哈~~ OpenCV是Intel®开源计算机视觉库.它由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法. ...

  6. 《Hadoop技术详解》一导读

    前 言 Hadoop技术详解 本书采用的约定 本书采用以下排版约定. 斜体 用于表明新的术语.URL.电子邮件地址.文件名和文件扩展名. 等宽字体 用于程序清单,正文段落中有关的程序元素,如变量及函数 ...

  7. “扫五福”的实现原理和技术详解

    前言 年关扫福的号角一吹响,日常社交用语里就多了一句:你有敬业福嘛?今年是集五福的第6年,这场搭载手机的年味仪式,让古早的"福"文化又登上新时代的C位. 不难发现,我们拿着手机,不 ...

  8. ios开发ocr识别_车牌识别技术

    核心技术:移动车牌识别技术,ios车牌识别,车牌识别技术移动端,移动端车牌识别技术,手机端车牌识别,OCR车牌识别,手机端车牌识别 移动端车牌识别OCR技术描述 移动端车牌识别OCR技术是我公司开发的 ...

  9. ×××技术详解(全)

    ×××技术详解(全)   一.引言   <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office ...

最新文章

  1. Github 树形菜单插件
  2. 返回content-length=0问题解决
  3. Linxu内核模块开发入门(金荣的第一篇个人技术博客)
  4. Node.js之readline模块的使用
  5. 002A demo of the Spectral Co-Clustering algorithm
  6. 地上有一个m行和n列的方格。一个机器人从坐标0,0的格子开始移动,每一次只能向左,右,上,下四个方向移动一格,但是不能进入行坐标和列坐标的数位之和大于k的格子。
  7. MySQL之用Mysql-Proxy实现读写分离
  8. 2019美赛备战日记1/18
  9. 一个产品经理的工作经历与总结
  10. 毕设设计要点整理(一)——角色相关
  11. alt复制选区就会卡 ps_10个小技巧解决运行PS卡死了的问题
  12. winrar远程代码执行漏洞(cve-2018-20250)
  13. Python读取Word文档段落或者表格
  14. nss什么意思计算机网络用语,nss是什么意思 网络语nss是什么意思
  15. 系统svchost占用内存特别大的处理
  16. android x86主动防御,LBE安全大师(主动式防御软件) for Android v6.1.2235 官网版 中文官方安装版...
  17. 关于SSM的家具购物系统的设计答辩问题合集
  18. 企业为什么着急签三方_为什么很多企业都在使用电子劳动合同?要怎么签?
  19. HDLbits——procedures
  20. IOS无法导出p12证书

热门文章

  1. 如何使用eclipse搭建maven环境以及常见的错误
  2. 微信小程序悬浮可拖动客服组件
  3. linux写入二进制文件内容,fopen , fread fwrite 函数读写二进制文件 问题总结
  4. 计算机考证照片大小要求
  5. [xdoj]1303jlz的刷题黑科技
  6. 原生JS实现——自定义播放器
  7. haproxy配置TCP代理
  8. 搜狗输入法如何开启截屏快捷键
  9. Java——类图、时序图、用例图
  10. 仿制斯坦福机械狗——组装过程