随着机器视觉的发展,光学字符识别(Optical Character Recognition,OCR)技术得到越来越广泛的应用。OCR字符检测是通过光学图像采集设备采集图像,接着基于图像处理系统进行图像的预处理、检测与识别。

OCR字符检测流程

字符识別算法是OCR字符检测技术的重要组成部分。OCR字符检测技术-般由图像预处理与字符识別两个部分组成。图像的预处理是对光学成像设备获取到的原始图像进行处理,进而将图像分割并归一化为一个个独立的字符;字符识别部分是将分割出的字符进行识别,并将识别出的字符信息整合成字符串信息进行输出。

采集到的原图像经过预处理后得到单枚字符,接着将单枚字符图像数据传入识别算法部分。常见的字符识别算法如下:

1、 模板匹配算法

模板匹配法是通过计算目标图像与搜索图中所有子图的相似度,其中相似度最大的即认为是最佳待匹配的位置。模板匹配法根据匹配的基本原理演变出多种匹配计算方式,如序贯相似性匹配、距离变换、最小均方误差等。这其中最简单的就是最简单的图像作差法,当然这种方法只适用于待识别的类型比较少,并且待识别的图像差异性比较大的场景当中。

OCR技术中使用模板匹配法时首先要建立标准的模板字符库,接着将待识别字符图像与模板字符库中字符进行匹配相似度计算,得到匹配相似度值最大的就是相对应的字符识别结果。模板匹配的优点在于识别过程直接采取两幅图像间的相似匹配度,在某些特定的场景中有着很高的实用性。

2、支持向量机

支持向量机(Support Vector Machine,SVM)是基于统计学理论的一种分类识别算法。SVM在小样本的分类领域的应用中具有很好的效果。经过长期发展,SVM出现了许多衍生算法,如最小二乘SVM、半监督SVM等。

支持向量机分类算法不仅对于小样本的情况具有较好的分类效果,并且对高维和线性不可分的问题进行了很好的解决,这是该算法的主要优点,但该算法也有弊端,例如核函数的选择,以及算法的实时性较差等问题。

3、贝叶斯分类算法

贝叶斯分类算法(Bayes)主要原理是通过Bayes定理对未知样本进行预测,并计算样本进行各个类别的可能性,最后通过概率统计对图像实现分类。贝叶斯分类方法的主要优点在于鲁棒性强,稳定性好;其缺点在于Bayes模型基础假设了不同属性间的概率独立,即相互不影响。因此,使用该方法时要考虑应用场景。

4、神经网络算法

神经网络算法常用在解决分类和回归问题。OCR技术中也广泛使用了基于神经网络的算法,字符图像在使用神经网络分类器进行识别时,根据网络的输入层的不同可以分为两种情况:一是将二维的字符图像直接作为网络的输入,将图像的各个像素点作为节点进行全连接,这种方法可以实现较高的识别正确率,且抗干扰能力强,但是网络运算量较大,会花费较长的时间训练网络;二是对字符图像进行特征提取,然后将提取到的字符特征信息作为祌经网络的输入来进行网络的训练,这种情况可以有效减少网络训练所需的时间,但这种方式训练的网络对字符识别正确率的高低取决于字符特征信息提取的有效程度。

随着OCR字符检测技术的飞速发展,应用领域逐渐渗透到工业、银行、半导体、交通运输等诸多领域。比如,笔记本外壳表面的字符检测系统中,可以通过识别表面的字符信息将笔记本外壳进行型号归类。在金属阀门的归类系统中,可以通过识别阀门表面标志的字符信息,将规格不同的阀门有效分离。在银行的单据识别系统中,可以通过OCR技术识别存取款金额,从而使机器能够进行自动化工作,提高了银行的工作效率。在衬布表面的疵点检测系统中,可以通过识别衬布表面标识的字符信息,将检测的成品进行分类入库。总之,将OCR字符检测技术应用到不同领域,都给生产生活带来了很大的便利。

OCR字符检测技术:常见的OCR字符识别算法相关推荐

  1. mysql 剔除不可见字符_机器视觉OCR字符检测在食品瓶盖上的应用

    随着生活水平不断提高,食品品质和安全已成为社会关注的焦点.人们对食品生产的要求变的越来越高,生产日期是我们评估食品安全与否的一个重要标准,因此,保证生产日期等相关信息正确清晰的标注是食品生产过程中的一 ...

  2. c语言cnn实现ocr字符,端到端的OCR:基于CNN的实现

    OCR是一个古老的问题.这里我们考虑一类特殊的OCR问题,就是验证码的识别.传统做验证码的识别,需要经过如下步骤: 1. 二值化 2. 字符分割 3. 字符识别 这里最难的就是分割.如果字符之间有粘连 ...

  3. 请详细介绍声发射检测技术

    声发射检测技术是一种用于检测声发射源的位置和特性的技术.这种技术通常使用声学传感器,如麦克风或声呐,来捕捉周围环境中的声音信号.这些信号通常会被用于计算声发射源的位置和特性. 声发射检测技术可以用于许 ...

  4. 【OCR技术系列之一】字符识别技术总览

    最近入坑研究OCR,看了比较多关于OCR的资料,对OCR的前世今生也有了一个比较清晰的了解.所以想写一篇关于OCR技术的综述,对OCR相关的知识点都好好总结一遍,以加深个人理解. 什么是OCR? OC ...

  5. 【OCR技术系列之五】自然场景文本检测技术综述(CTPN, SegLink, EAST)

    文字识别分为两个具体步骤:文字的检测和文字的识别,两者缺一不可,尤其是文字检测,是识别的前提条件,若文字都找不到,那何谈文字识别.今天我们首先来谈一下当今流行的文字检测技术有哪些. 文本检测不是一件简 ...

  6. 中文OCR光学字符检测与识别二:用最先进的DBNet训练自己的数据集检测中文文本

    中文OCR光学字符检测与识别二:用最先进的DBNet训练自己的数据集检测中文文本 本文介绍 中文OCR光学字符检测与识别二:用最先进的DBNet训练自己的数据集检测中文文本 中文OCR光学字符检测与识 ...

  7. OCR文本识别,文本行检测技术。

    文本行检测技术,我们分传统方法和深度学习方法两种技术方案.传统的文本行检测技术,优势是速度快,对于公文类文档效果较好.缺点是对复杂背景图像如行驶证.银行卡.出租车票等这类图像检测效果较差. 传统的OC ...

  8. Halcon学习笔记(九)——OCR实战练习 倾斜日期检测、倒着的字符检测

    第四-八讲 OCR实战练习 在基于之前的例程分析之上,这里做具体应用,比如,食品包装袋上倾斜的日期识别,温度计上倒着的字符识别等. 倾斜日期识别 首先,对于这样一幅图片,怎样实现对日期的提取? 法一: ...

  9. OCR(Optical Character Recognition,光学字符识别)技术详解

    OCR(Optical Character Recognition,光学字符识别)技术是一种将图像中的文字信息转换为文本的技术.在计算机视觉和人工智能领域,OCR 技术是一个非常重要的应用,它可以帮助 ...

最新文章

  1. 数据类型:Struct 和 Union区别
  2. 一张图带你看清2014年就业形势-管理专业排名第一,就业难
  3. Unity3D_(游戏)贪吃蛇
  4. Cygwin获取root权限
  5. 【C 语言】二级指针作为输入 ( 自定义二级指针内存 | 二级指针 排序 | 通过 交换指针方式 进行排序 )
  6. python 实现倒排索引,建立简单的搜索引擎
  7. 图像还可以这样玩!如何用波的算法处理图像
  8. php 输出mysql查询结果_php如何输出mysql查询结果
  9. 织梦php版本图片不能上传,织梦Dedecms会员中心无法上传图片的解决方法
  10. 2、Angular2 Directive
  11. React+Webpack+Webstorm开发环境搭建
  12. # 保利威视频在线分析下载
  13. ruoyi 若依 VUE 宝塔 Nignx部署 伪静态配置
  14. typescript是像java吗_typescript参照C#/java/swift学习小结
  15. NVMe 协议详解(一)
  16. 如何将自己做的网页发布到网站让别人可以看到
  17. 内网穿透工具(永久免费、永不限速、开源)、一键启动、页面操作(支持window,mac),自定义二级域名
  18. 大学物理实验长度的测量实验报告_大学物理实验长度测量
  19. String字符串转Date日期
  20. 历史演变有助于理解css布局的本质

热门文章

  1. 聊城大学计算机学院操作系统,聊城大学计算机学院操作系统试题1.doc
  2. 使用python抓包并分析后存入数据库,或直接分析tcpdump和wireshark抓到的包,并存入数据库
  3. 计算机三维动画的应用领域有哪些,三维动画的应用领域
  4. Windows下100个CMD常用命令(1)
  5. qq空间里的照片久了就模糊了怎么修复?
  6. bug生命周期的几个状态
  7. 南昌二中高考2021成绩查询,南昌2018各学校高考喜报合集
  8. GIT带着子模块拉取代码
  9. 猴群选猴王(约瑟夫问题)详解
  10. 网游防沉迷:一条摆设的马其诺防线