一、OCR技术的发展历程

OCR(Optical Character Recognition)的概念诞生于1929年,由德国的科学家Tausheck首先提出,并且申请了专利。几年后,美国科学家Handel也提出了对文字进行识别的想法,但这种梦想直到计算机诞生后才变成为现实。现在这一技术已经由计算机来实现,OCR的意思也就演变成为利用光学技术对文字和字符进行扫描识别,并将其转化为计算机内码。

据记载,第一个OCR软件是在1957年开发的ERA(Electric Reading Automation)。它是基于窥视孔方法实现的,识别的速度是每秒120个英文字母。在此以后,世界范围内广泛地进行着OCR技术的研究和开发工作。从OCR技术的发展历程来看,可分为三个阶段:

第一阶段:第一代OCR产品出现于60年代初期,NCR公司、Farrington公司、IBM公司分别研制出了自己的OCR软件。最早的OCR产品应该是IBM公司的IBM1418。它只能识别印刷体的数字、英文字母及部分符号,并且必须是指定的字体。

第二阶段:第二代OCR产品是基于手写体字符的识别,前期只限于手写体数字的识别,从时间上来看,是60年代中期到70年代初期。IBM公司于1965年便在“纽约世界博览会”上展出了其OCR产品-IBM1287。第一个实现手写体邮政编码识别的信函自动分拣系统是由日本东芝公司研制的,两年后NEC公司也推出了同样的系统。到1974年,信函的分拣率达到92%~93%,并且广泛地应用在现实生活中,发挥着较好的作用。

第三阶段:第三代OCR产品主要解决的技术问题就是对于质量较差的文档及大字符集的识别,例如汉字的识别。最先投入汉字识别研究的日本东芝公司,于1983年发布了其识别印刷体日文汉字的OCR系统-OCR-V595,其识别速度为每秒70~100个汉字,最高识别率达到99.5%。

二、中文OCR

我国在OCR技术方面的研究工作起步较晚,在70年代才开始对数字、英文字母及符号的识别进行研究;70年代末开始进行汉字识别的研究;到1986年汉字识别的研究进入一个实质性阶段,取得了较大的成果。当年,国家863计划信息领域课题组织了清华大学、北京信息工程学院、沈阳自动化所三家单位联合进行中文OCR软件的开发工作。至1989年,清华大学率先推出了国内第一套中文OCR软件--清华文通TH-OCR1.0版,至此中文OCR正式从实验室走向了市场。清华OCR印刷体汉字识别软件其后又推出了TH-OCR 92高性能实用简/繁体、多字体、多功能印刷汉字识别系统,使印刷体汉字识别技术又取得重大进展。到1994年推出的TH-OCR 94高性能汉英混排印刷文本识别系统,则被专家鉴定为“是国内外首次推出的汉英混排印刷文本识别系统,总体上居国际领先水平”。上个世纪90年代中后期,清华大学电子工程系提出并进行了汉字识别综合研究,使汉字识别技术在印刷体文本、联机手写汉字识别、脱机手写汉字识别和脱机手写数字符号识别等领域全面地取得了重要成果。具有代表性的成果是TH-OCR 97综合集成汉字识别系统,它可以完成多文种(汉、英、日)印刷文本、联机手写汉字、脱机手写汉字和手写数字的识别输入。

从中文OCR技术的发展来看,其研发与应用经历了如下几个阶段:

1、印刷体单字体识别,支持国标一级汉字3755字、繁体5401字,简繁体和字体由用户指明,识别率在95%左右;

2、印刷体多字体识别,支持国标一级汉字3755字,繁体5401字,简繁体由用户指明,宋仿楷黑四体混合识别,识别率在95%左右,对质量较差的印刷文稿的识别率会明显下降,印刷体表格的识别系统开始出现;

3、多字体大字符集简繁混排、中英文混排识别,支持国标二级汉字6763字、繁体5401字、香港常用字等1万多字,识别字体扩充到常见的十多种字体,识别率在99%左右,对质量较差的印刷文稿的识别率有较强的适应性,脱机手写数字识别和印刷体表格识别系统进入实用化阶段;

4、各种应用系统开始推出,如名片识别系统、身份证银行卡识别系统、车牌识别系统、银行票据识别系统、增值税发票识别认证系统等。

三、OCR的基本原理

简单地说,OCR的基本原理就是通过扫描仪将一份文稿的图像输入给计算机,然后由计算机取出每个文字的图像,并将其转换成汉字的编码。其具体工作过程是,扫描仪将汉字文稿通过电荷耦合器件CCD将文稿的光信号转换为电信号,经过模拟/数字转换器转化为数字信号传输给计算机。计算机接受的是文稿的数字图像,其图像上的汉字可能是印刷汉字,也可能是手写汉字,然后对这些图像中的汉字进行识别。对于印刷体字符,首先采用光学的方式将文档资料转换成原始黑白点阵的图像文件,再通过识别软件将图像中的文字转换成文本格式,以便文字处理软件的进一步加工。其中文字识别是OCR的重要技术。

四、市场成熟的OCR产品

目前市场上较为成熟的OCR产品有:证件识别SDK、车牌识别SDK、文档识别SDK、银行卡识别SDK、表格识别SDK、票据识别SDK、名片识别SDK、护照识别SDK、身份证识别SDK。目前,银行、保险、金融、税务、海关、公安、边检、物流、电信工商管理、图书馆、户籍管理、审计等很多行业都已经应用了OCR技术。OCR技术让大家减少了设备配置,降低了人力成本,提高了工作效率。

OCR技术的发展及应用相关推荐

  1. OCR - 关于OCR技术体系的发展的了解

    一.光学字符识别(OCR) 光学字符识别(Optical Character Recognition, OCR)这一概念,最早由德国科学家Tausheck在1929年提出. 汉字识别最早是由IBM公司 ...

  2. 数平精准推荐 | OCR技术之系统篇

    导语:如果说算法和数据是跑车的发动机和汽油,那么系统则是变速箱,稳定而灵活的变速箱,是图像识别服务向前推进的基础.算法.数据.系统三位一体,随着算法的快速发展和数据的日益积累,系统也在高效而稳定地升级 ...

  3. python用ocr技术识别_使用Python和OCR实现图像识别

    背景 光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程.OCR技术非常专业,一般多是印刷. ...

  4. OCR技术在爱奇艺的应用实践及演进

    随着人工智能的热度上升,图像识别这一细分领域也渐渐被人们所关注.在很多公司的业务中,有很多需要对图片进行识别的需求.为了帮助业务实现对这些图片.文档的识别和结构化,业界进行了一系列的实践和探索,最终确 ...

  5. OCR研究与发展的历史回顾

    Historical Review of OCR Research and Development 文章目录 摘要 1 介绍 2 OCR的黎明 3 试一试的时代 3.1 模板匹配方法 3.2 结构分析 ...

  6. 数平精准推荐 | OCR技术之数据篇

    导语:深度学习在OCR领域的成功应用需要大量数据,数平精准推荐团队利用图像增强,语义理解,生成对抗网络等技术生成高质足量的数据,为算法模型提供燃料,帮助OCR技术服务在多种业务场景中快速迭代,提升效果 ...

  7. OCR技术1-字符识别技术总览

    什么是OCR? OCR英文全称是Optical Character Recognition,中文叫做光学字符识别.它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受 ...

  8. 使用OCR技术将扫描PDF转换为可编辑的Word文档。

    随着技术的发展,越来越多的文档以PDF格式存储和分享.不过,PDF文档通常是静态的,不能编辑.如果您需要编辑PDF文件中的文本,您可以使用光学字符识别(OCR)技术将PDF转换为可编辑的Word文档. ...

  9. OCR技术识别文档的技术

    OCR技术识别文档的概括 我们常说的OCR.文字识别.OCR技术识别文档是指通过电子设备等将纸质上的文字识别出来,形成可编辑的文字. OCR技术识别文档的流程 随着扫描仪的普及与广泛应用,再加上摄像头 ...

最新文章

  1. 几十年的领域专家告诉你,机器翻译进化到哪一步了?
  2. No_16_0303 Java基础学习第十一天
  3. 63.死锁和死锁的原因
  4. 实验四 [bx]和loop的使用+段前缀
  5. 进虚拟ftp服务器跳网页,ftp服务器总是自动跳到网页
  6. 计算机网络「四」 网络层
  7. 【电子签章】HTML格式合同转化成PDF文件 已下载
  8. 业界首款!小米10至尊纪念版将有屏下摄像头版本
  9. Python常用的设计模式
  10. winrm java客户端_Windows 远程管理WinRM | 学步园
  11. 如何用Python记录微信撤回的消息
  12. Wechaty 李卓桓:我想要某种功能,你没有?那我来一个
  13. 牛客练习赛50(牛客1080F):F.tokitsukaze and Another Protoss and Zerg(组合数学 + NTT + 启发式)
  14. C语言那些事之脉冲丢包率检测
  15. 转行做数据分析的心路历程
  16. 【python 淘宝爬虫】python 淘宝店铺名称,旺旺,销售量 抓取
  17. Linux常用命令介绍
  18. SAP开发框架系列之 自定义单据
  19. IOS AppDelegate详解
  20. 【百度快照优化公司】网站的百度快照优化技巧

热门文章

  1. Fire Spell Effects特效简单记录
  2. IBM朱近之:云计算之九大特征
  3. layui的laypage分页插件使用
  4. 后端存储实战-极客时间
  5. Revit API:楼梯元素 Run、Landing、Support
  6. 你是怎么看完《JavaScript权威指南》《JavaScript高级程序设计》等这类厚书的?
  7. sam/bam格式说明
  8. 建筑建材行业采购平台解决方案
  9. uni.createInnerAudioContext`在ios手机无法自动播放,可通过`jweixin-module`来解决
  10. anchorPoint