【AI实战】超赞的几个OCR开源项目
超赞的几个OCR开源项目
- OCR
- 历史背景
- 早期的OCR软件结构
- 超赞的几个OCR开源项目介绍
- 其他开源项目
OCR
OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。
点击查看百科:OCR文字识别 介绍
历史背景
光学文字识别的概念是在1929年由德国科学家Tausheck最先提出来的,后来美国科学家Handel也提出了利用技术对文字进行识别的想法。而最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy,1966年他们发表了第一篇关于汉字识别的文章,采用了模板匹配法识别了1000个印刷体汉字。
20世纪70年代初,日本的学者开始研究汉字识别,并做了大量的工作。
1986年以后我国的OCR研究有了很大进展,在汉字建模和识别方法上都有所创新,在系统研制和开发应用中都取得了丰硕的成果,不少单位相继推出了中文OCR产品。
早期的OCR软件结构
1、图像输入、预处理
2、二值化
3、噪声去除
4、倾斜较正
5、版面分析
6、字符切割
7、字符识别
8、版面恢复
9、后处理、校对
超赞的几个OCR开源项目介绍
第一名:PaddleOCR
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。
开源地址:https://github.com/PaddlePaddle/PaddleOCR
特性
支持多种OCR相关前沿算法,在此基础上打造产业级特色模型PP-OCR和PP-Structure,并打通数据生产、模型训练、压缩、预测部署全流程。
在线网站体验:
超轻量PP-OCR mobile模型体验地址:https://www.paddlepaddle.org.cn/hub/scene/ocr移动端demo体验:
安装包DEMO下载地址(基于EasyEdge和Paddle-Lite, 支持iOS和Android系统)https://ai.baidu.com/easyedge/app/openSource?from=paddlelite文本检测算法效果
文本识别算法效果
第二名:EasyOCR
Ready-to-use OCR with 80+ supported languages and all popular writing scripts including: Latin, Chinese, Arabic, Devanagari, Cyrillic, etc.
开源地址:https://github.com/JaidedAI/EasyOCR
算法效果
DEMO地址
https://www.jaided.ai/easyocr教程
https://www.jaided.ai/easyocr/tutorial
第三名:chineseocr
本项目基于yolo3 与crnn 实现中文自然场景文字检测及识别
该项目提供了数据集
ocr ctc训练数据集(压缩包解码:chineseocr)
百度网盘地址:链接: https://pan.baidu.com/s/1UcUKUUELLwdM29zfbztzdw 提取码: atwn实现功能
文字方向检测 0、90、180、270度检测(支持dnn/tensorflow)
支持(darknet/opencv dnn /keras)文字检测,支持darknet/keras训练
不定长OCR训练(英文、中英文) crnn\dense ocr 识别及训练 ,新增pytorch转keras模型代码(tools/pytorch_to_keras.py)其他说明:
https://github.com/chineseocr/chineseocr#readme
第四名:YCG09/chinese_ocr
基于Tensorflow和Keras实现端到端的不定长中文字符检测和识别
文本检测:CTPN
文本识别:DenseNet + CTC该项目提供了数据集:
https://pan.baidu.com/s/1QkI7kjah8SPHwOQ40rS1Pw (密码:lu7m)共约364万张图片,按照99:1划分成训练集和验证集
数据利用中文语料库(新闻 + 文言文),通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成
包含汉字、英文字母、数字和标点共5990个字符
每个样本固定10个字符,字符随机截取自语料库中的句子
图片分辨率统一为280x32
其他开源项目
https://github.com/eragonruan/text-detection-ctpn
https://github.com/senlinuc/caffe_ocr
https://github.com/chineseocr/chinese-ocr
https://github.com/xiaomaxiao/keras_ocr
https://github.com/alisen39/TrWebOCR
https://github.com/da03/Attention-OCR
https://github.com/JinpengLI/deep_ocr
【AI实战】超赞的几个OCR开源项目相关推荐
- 实测超轻量中文OCR开源项目,总模型仅17M
本文授权转自"机器之心"(almosthuman2014) 光学字符识别(OCR)现在已经有很广泛的应用了,很多开源项目都会嵌入已有的 OCR 项目来扩展能力,例如 12306 开 ...
- Ubuntu环境使用conda安装轻量级中文ocr开源项目chineseocr_lite,最简单的方式
问题 接使用docker的方式来创建项目所报的错误 选中文件之后,界面不停的绕圈,显示不了对于图片的识别结果,并且监控界面上出现错误提示如下 ImportError: libpython3.6m.so ...
- 炸裂!PDF转Word彻底告别收费时代,这个OCR开源项目要逆天!
1.导读 随着企业数字化进程不断加速,PDF转Word的功能.纸质文本的电子化存储.文件复原与二次编辑.信息检索等应用都有着强烈的企业需求.目前市面上已有一些软件,但普遍需要繁琐的安装注册操作,大多还 ...
- 【UbuntuROS】干货!小伙伴们快来拿,超全机械臂抓取开源项目!
一.基础入门 1.首先对机械臂的整体认识: http://blog.exbot.net/archives/3337 2.CSDN上一个博主写的抓取.机械臂控制.机械臂抓取的代码解析: https:// ...
- OCR识别开源项目对比
OCR技术路线图总体上可分为五步: 图像预处理.切割字符.识别字符.恢复版面.后处理文字. OCR识别常见的八大开源工具-51CTO.COM https://www.toutiao.com/artic ...
- AAAI 2021 顶会论文开源,OCR方向最火开源项目已超1万 star!
一.导读 OCR方向的工程师,一定需要知道这个OCR开源项目:PaddleOCR 短短半年时间,累计Star数量已超过11.5K, 频频登上Github Trending和Paperswithcode ...
- 最新OCR开源神器来了!
Datawhale开源 开源方向:OCR开源项目 01 导读 OCR方向的工程师,之前一定听说过PaddleOCR这个项目,其主要推荐的PP-OCR算法更是被国内外企业开发者广泛应用,短短半年时间,累 ...
- 截屏、文字提取一气呵成,超实用 OCR 开源小工具
点击上方"逆锋起笔",关注领取学习资源 ☞ 程序员进阶必备资源免费送「各种技术!」 ☜ 本文转载自机器之心 这个文本 OCR 小工具,能让你「所截即所得」. 在我们办公时,是不是经 ...
- Golang流媒体实战之一:体验开源项目lal
欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 关于<Golang流媒体实战> 因为工作需 ...
最新文章
- python中的栈结构_python中有栈吗
- '#selector' does not refer to an '@objc' method,No method declared with Objective-C selector 'compos
- linux sd卡 u盘区别,linux下实现U盘和sd卡的自动挂载
- python 列表写入csv_Python将字典数据写入CSV文件
- 最小生成树算法(两个方法实现)
- linux 下自动重启tomcat的脚本(支持shell杀进程)
- php的select case语句,调用不同SELECT语句的MySQL IF / CASE语法
- 池流程图_干货收藏 | Java程序员必备的一些流程图
- 如何下载高程地图并处理
- 微信开发工具无法支持vue文件
- 联想ERP项目实施案例分析(9):工作方法总结
- PS 一键生成Android各个尺寸的图标
- 宋体能力从业的一些感悟
- Python + seleniume 清除chrome浏览器历史记录
- 好看更好玩的vivo S12 Pro,越用越顺手
- JAVA算法:李白遇花喝酒游戏JAVA DFS 算法设计
- 免费音视频格式转换软件
- mysql string长度限制_String的长度限制
- 引擎TA校园招聘: 搜狐畅游 追光者计划简介
- STM32变频器 源程序是经批量验证过的原始代码,仅支持VF控制,C语言实现,完全开源,Keil uVision4编译无错误
热门文章
- lockbit勒索病毒专杀工具,.lockbit勒索病毒数据恢复,lockbit勒索病毒解密处理,数据库恢复
- qgis自动获取建筑和道路矢量
- 小白学数据 | 28张小抄表大放送:Python,R,大数据,机器学习
- Python图像处理丨带你认识图像量化处理及局部马赛克特效
- android最早的版本,Android版本演进史
- java实现基于snmp的网络拓扑发现
- Java Stream如何写出高雅又装*的代码
- Django计算机毕业设计-Java网名推荐系统(程序+LW)Python
- java sqlserver2000_用Java连接SQL Server2000数据库
- 全新后门文件Nev-3.exe分析