现如今网络化时代,图书馆、报社及出版社都加快了纸质文档资源的数字化、网络化的发展,产生了大量的电子文档、音频及视频等数字信息,从形式到内容上都极大的丰富了图书馆或报社、出版社的资源。面对这些海量的资源,如何更好的利用,发掘出这些资源的价值,成为这些单位面临的一个重要问题。本文将介绍文通的一种利用OCR技术进行文档、书籍资源开发、利用的方式。

  1、OCR技术文献数字化:

  基于OCR技术的文字识别软件,可以将通过摄像机、扫描仪等光学输入方式得到的报刊、书籍、文稿、表格等印刷品的图像信息转化为可供计算机识别和处理的文本信息。与传统录入方式相比,OCR技术极大的提高了资料存储、检索、加工的效率。

  2、OCR技术的特点:

  与传统的手工资料录入方式相比,文通文字识别软件有以下优势:

  (1)效率高,其速度是人工录入的上百倍甚至上千倍;

  (2)经济性好,大大节约了录入人员的开销;

  (3)准确性更高,根据数据统计显示,OCR录入方式的准确率远高于人工录入。

  3、OCR的技术支持,文字识别软件

  以清华光学字符识别TH-OCR为核心开发的文字识别软件--TH-OCR数据录入工厂,同时还提供文档影像技术和应用解决方案,为文档影像技术的发展做出了很大的贡献。

  集字校对

  TH-OCR文字识别软件采用UNICODE国际编码标准,内置最新研发的高性能文字识别引擎,中文识别率达99.8%以上。英文、日文、韩文的识别率居世界领先水平。

  同时还具有版面还原、集字校对、自学习特殊文字、双层PDF批量制作等实用功能,是目前市场上最好用的文字识别、处理软件,广泛应用于图书馆、电力行业、出版社、报社、政府机关,为用户带来极大的便利,并大大提升了他们的工作效率。

OCR技术使书籍报刊电子化相关推荐

  1. OCR技术学习,智能文档图像处理技术应用与实践

    目录 一.智能文字识别一般包含以下几个过程 1.图像输入 2.图像预处理 (1)弯曲矫正系统pipeline (2)摩尔纹去除 3.版面分析 4.字符切割 5.字符识别 6.版面恢复 7.后处理.核对 ...

  2. 数平精准推荐 | OCR技术之系统篇

    导语:如果说算法和数据是跑车的发动机和汽油,那么系统则是变速箱,稳定而灵活的变速箱,是图像识别服务向前推进的基础.算法.数据.系统三位一体,随着算法的快速发展和数据的日益积累,系统也在高效而稳定地升级 ...

  3. 数平精准推荐 | OCR技术之数据篇

    导语:深度学习在OCR领域的成功应用需要大量数据,数平精准推荐团队利用图像增强,语义理解,生成对抗网络等技术生成高质足量的数据,为算法模型提供燃料,帮助OCR技术服务在多种业务场景中快速迭代,提升效果 ...

  4. VIN码识别又叫车架号识别,OCR技术深度应用

    什么叫VIN码? VIN码又叫车架号也叫车辆识别代码,是制造厂为了识别而给一辆车指定的一组编号.由于VIN码的数字和英文字母是不断切换,共有十七个数字及字母组成的编码. 现在,通过自主研发的OCR技术 ...

  5. OCR技术1-字符识别技术总览

    什么是OCR? OCR英文全称是Optical Character Recognition,中文叫做光学字符识别.它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受 ...

  6. 使用OCR技术将扫描PDF转换为可编辑的Word文档。

    随着技术的发展,越来越多的文档以PDF格式存储和分享.不过,PDF文档通常是静态的,不能编辑.如果您需要编辑PDF文件中的文本,您可以使用光学字符识别(OCR)技术将PDF转换为可编辑的Word文档. ...

  7. OCR技术识别文档的技术

    OCR技术识别文档的概括 我们常说的OCR.文字识别.OCR技术识别文档是指通过电子设备等将纸质上的文字识别出来,形成可编辑的文字. OCR技术识别文档的流程 随着扫描仪的普及与广泛应用,再加上摄像头 ...

  8. OCR技术(光学字符识别)

    什么是OCR? OCR英文全称是optical character recognition,中文叫光学字符识别.它是利用光学技术和计算机技术把印在或者写在纸上的 文字读取出来,并转换成一种计算机能够接 ...

  9. 图像识别,ocr 技术,有兴趣的可以了解一下

    我现在的项目有一个需求,就是把拍照的照片上面的文字识别出来,然后上传到服务器,录入数据,其实图像识别技术是很难的一个技术. (这是我的github里面的地址,关于ocr 的demo~>  htt ...

最新文章

  1. java 假设当前时间_Java如何比较当前时间是否在两个时间范围内
  2. ABAP内表(internal table)有关的系统变量
  3. PowerDesigner165安装婆姐汉花教程
  4. html checked属性值,HTML复选框的checked属性的值是多少?
  5. hdu 1512 Monkey King 左偏树
  6. iphone照片删掉又出现_30条让人相见恨晚的iPhone使用技巧。
  7. 【Java】身份证的验证
  8. StanfordDB class自学笔记 (14) On-Line Analytical Processing
  9. ADI官方提供的源码AD9361+ZC706 利用TCL构建Vivado工程,利用no-OS-master搭建SDK工程
  10. 微信小程序分享朋友圈API限制问题
  11. kafka生产者发送消息提升效率策略设置
  12. 【*如何捱过寂寥萧瑟的秋季*】
  13. 利用 Maxima 求解常微分方程
  14. java 生成拼音_java工具-常用汉语转拼音库Pinyin4j 、tinypinyin、JPinyin
  15. 非对称加密-区块链核心技术之一
  16. 模拟电子技术基础------单管共射放大电路
  17. E6-2019级航类第6次正式上机
  18. NGUI动态字体的制作
  19. 如何对振弦式渗压计进行数据读取和处理
  20. element table里的嵌入的input框设置只能输入英文和数字

热门文章

  1. 基于JAVA薪酬福利管理信息系统计算机毕业设计源码+系统+数据库+lw文档+部署
  2. Ubuntu 14.04自动更换壁纸
  3. word修订功能的使用方法:修改论文…
  4. 一步一步学Linq to sql(三):增删改
  5. 人脸对齐 - ERP 和 LBF
  6. 【进阶篇】全流程学习《20天掌握Pytorch实战》纪实 | Day10 | 高阶API示范
  7. 低热减脂双重减肥食谱
  8. 阿里巴巴Java开发手册v1.3.0
  9. 大数据分析案例-基于XGBoost算法构造房屋租赁价格评估模型
  10. 码云注册以及绑定git使用