超赞的几个OCR开源项目

  • OCR
  • 历史背景
  • 早期的OCR软件结构
  • 超赞的几个OCR开源项目介绍
  • 其他开源项目

OCR

OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。
点击查看百科:OCR文字识别 介绍

历史背景

光学文字识别的概念是在1929年由德国科学家Tausheck最先提出来的,后来美国科学家Handel也提出了利用技术对文字进行识别的想法。而最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy,1966年他们发表了第一篇关于汉字识别的文章,采用了模板匹配法识别了1000个印刷体汉字。

20世纪70年代初,日本的学者开始研究汉字识别,并做了大量的工作。

1986年以后我国的OCR研究有了很大进展,在汉字建模和识别方法上都有所创新,在系统研制和开发应用中都取得了丰硕的成果,不少单位相继推出了中文OCR产品。

早期的OCR软件结构

1、图像输入、预处理

2、二值化

3、噪声去除

4、倾斜较正

5、版面分析

6、字符切割

7、字符识别

8、版面恢复

9、后处理、校对

超赞的几个OCR开源项目介绍

  • 第一名:PaddleOCR

    • PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。

    • 开源地址:https://github.com/PaddlePaddle/PaddleOCR

    • 特性
      支持多种OCR相关前沿算法,在此基础上打造产业级特色模型PP-OCR和PP-Structure,并打通数据生产、模型训练、压缩、预测部署全流程。

    • 在线网站体验:
      超轻量PP-OCR mobile模型体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr

    • 移动端demo体验:
      安装包DEMO下载地址(基于EasyEdge和Paddle-Lite, 支持iOS和Android系统)https://ai.baidu.com/easyedge/app/openSource?from=paddlelite

    • 文本检测算法效果

    • 文本识别算法效果

  • 第二名:EasyOCR

    • Ready-to-use OCR with 80+ supported languages and all popular writing scripts including: Latin, Chinese, Arabic, Devanagari, Cyrillic, etc.

    • 开源地址:https://github.com/JaidedAI/EasyOCR

    • 算法效果

    • DEMO地址
      https://www.jaided.ai/easyocr

    • 教程
      https://www.jaided.ai/easyocr/tutorial

  • 第三名:chineseocr

    • 本项目基于yolo3 与crnn 实现中文自然场景文字检测及识别

    • 该项目提供了数据集
      ocr ctc训练数据集(压缩包解码:chineseocr)
      百度网盘地址:链接: https://pan.baidu.com/s/1UcUKUUELLwdM29zfbztzdw 提取码: atwn

    • 实现功能
      文字方向检测 0、90、180、270度检测(支持dnn/tensorflow)
      支持(darknet/opencv dnn /keras)文字检测,支持darknet/keras训练
      不定长OCR训练(英文、中英文) crnn\dense ocr 识别及训练 ,新增pytorch转keras模型代码(tools/pytorch_to_keras.py)

    • 其他说明:
      https://github.com/chineseocr/chineseocr#readme

  • 第四名:YCG09/chinese_ocr

    • 基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别

      文本检测:CTPN
      文本识别:DenseNet + CTC

    • 该项目提供了数据集:
      https://pan.baidu.com/s/1QkI7kjah8SPHwOQ40rS1Pw (密码:lu7m)

      共约364万张图片,按照99:1划分成训练集和验证集
      数据利用中文语料库(新闻 + 文言文),通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成
      包含汉字、英文字母、数字和标点共5990个字符
      每个样本固定10个字符,字符随机截取自语料库中的句子
      图片分辨率统一为280x32

其他开源项目

https://github.com/eragonruan/text-detection-ctpn

https://github.com/senlinuc/caffe_ocr

https://github.com/chineseocr/chinese-ocr

https://github.com/xiaomaxiao/keras_ocr

https://github.com/alisen39/TrWebOCR

https://github.com/da03/Attention-OCR

https://github.com/JinpengLI/deep_ocr

【AI实战】超赞的几个OCR开源项目相关推荐

  1. 实测超轻量中文OCR开源项目,总模型仅17M

    本文授权转自"机器之心"(almosthuman2014) 光学字符识别(OCR)现在已经有很广泛的应用了,很多开源项目都会嵌入已有的 OCR 项目来扩展能力,例如 12306 开 ...

  2. Ubuntu环境使用conda安装轻量级中文ocr开源项目chineseocr_lite,最简单的方式

    问题 接使用docker的方式来创建项目所报的错误 选中文件之后,界面不停的绕圈,显示不了对于图片的识别结果,并且监控界面上出现错误提示如下 ImportError: libpython3.6m.so ...

  3. 炸裂!PDF转Word彻底告别收费时代,这个OCR开源项目要逆天!

    1.导读 随着企业数字化进程不断加速,PDF转Word的功能.纸质文本的电子化存储.文件复原与二次编辑.信息检索等应用都有着强烈的企业需求.目前市面上已有一些软件,但普遍需要繁琐的安装注册操作,大多还 ...

  4. 【UbuntuROS】干货!小伙伴们快来拿,超全机械臂抓取开源项目!

    一.基础入门 1.首先对机械臂的整体认识: http://blog.exbot.net/archives/3337 2.CSDN上一个博主写的抓取.机械臂控制.机械臂抓取的代码解析: https:// ...

  5. OCR识别开源项目对比

    OCR技术路线图总体上可分为五步: 图像预处理.切割字符.识别字符.恢复版面.后处理文字. OCR识别常见的八大开源工具-51CTO.COM https://www.toutiao.com/artic ...

  6. AAAI 2021 顶会论文开源,OCR方向最火开源项目已超1万 star!

    一.导读 OCR方向的工程师,一定需要知道这个OCR开源项目:PaddleOCR 短短半年时间,累计Star数量已超过11.5K, 频频登上Github Trending和Paperswithcode ...

  7. 最新OCR开源神器来了!

    Datawhale开源 开源方向:OCR开源项目 01 导读 OCR方向的工程师,之前一定听说过PaddleOCR这个项目,其主要推荐的PP-OCR算法更是被国内外企业开发者广泛应用,短短半年时间,累 ...

  8. 截屏、文字提取一气呵成,超实用 OCR 开源小工具

    点击上方"逆锋起笔",关注领取学习资源 ☞ 程序员进阶必备资源免费送「各种技术!」 ☜ 本文转载自机器之心 这个文本 OCR 小工具,能让你「所截即所得」. 在我们办公时,是不是经 ...

  9. Golang流媒体实战之一:体验开源项目lal

    欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 关于<Golang流媒体实战> 因为工作需 ...

最新文章

  1. python中的栈结构_python中有栈吗
  2. '#selector' does not refer to an '@objc' method,No method declared with Objective-C selector 'compos
  3. linux sd卡 u盘区别,linux下实现U盘和sd卡的自动挂载
  4. python 列表写入csv_Python将字典数据写入CSV文件
  5. 最小生成树算法(两个方法实现)
  6. linux 下自动重启tomcat的脚本(支持shell杀进程)
  7. php的select case语句,调用不同SELECT语句的MySQL IF / CASE语法
  8. 池流程图_干货收藏 | Java程序员必备的一些流程图
  9. 如何下载高程地图并处理
  10. 微信开发工具无法支持vue文件
  11. 联想ERP项目实施案例分析(9):工作方法总结
  12. PS 一键生成Android各个尺寸的图标
  13. 宋体能力从业的一些感悟
  14. Python + seleniume 清除chrome浏览器历史记录
  15. 好看更好玩的vivo S12 Pro,越用越顺手
  16. JAVA算法:李白遇花喝酒游戏JAVA DFS 算法设计
  17. 免费音视频格式转换软件
  18. mysql string长度限制_String的长度限制
  19. 引擎TA校园招聘: 搜狐畅游 追光者计划简介
  20. STM32变频器 源程序是经批量验证过的原始代码,仅支持VF控制,C语言实现,完全开源,Keil uVision4编译无错误

热门文章

  1. lockbit勒索病毒专杀工具,.lockbit勒索病毒数据恢复,lockbit勒索病毒解密处理,数据库恢复
  2. qgis自动获取建筑和道路矢量
  3. 小白学数据 | 28张小抄表大放送:Python,R,大数据,机器学习
  4. Python图像处理丨带你认识图像量化处理及局部马赛克特效
  5. android最早的版本,Android版本演进史
  6. java实现基于snmp的网络拓扑发现
  7. Java Stream如何写出高雅又装*的代码
  8. Django计算机毕业设计-Java网名推荐系统(程序+LW)Python
  9. java sqlserver2000_用Java连接SQL Server2000数据库
  10. 全新后门文件Nev-3.exe分析