前提假设:

1. 所要检测的图片是纯文本或者文字,最好是只有一行; 或者截图只有一行文本的图片。如下图

图片名称: text03.jpg

2. 从文本检测(深度学习网络)软件检测到的 包含文本区域的图片。

开源文本识别软件(OCR)

Tesseract-OCR

下载链接:https://digi.bib.uni-mannheim.de/tesseract/

可以根据自己的电脑操作系统位数决定下载32位 或者 64位,按照时间顺序,可以下载最新的版本。

安装步骤:

下载完后,是 .exe格式文件,点击安装,一直下一步就可以了。

注释: 如果有提示:选择下载包(在additional language data (download 下选择中数学公式库和中文库Chinese(simplified)(traditional)),两者都选上, 点击“next”继续

注释:如果选中additional的√ 钩号, 安装时可能提示一个错误,不管它,直接按 enter 键盘按键,直到装完。

笔者是装在 E:| 盘,,,目录是E:\ Tesseract-OCR

环境配置:

1. 将Tesseract-OCR安装目录(E:\Tesseract-OCR)加入环境变量path中;    环境变量获取方式:右键 桌面上的 “计算机”图标, 然后如下图所示。 双击 PATH 在最末尾加入刚刚软件安装的目录。

2 新建环境变量,变量名TESSDATA_PREFIX 并赋值为E:\Tesseract-OCR\tessdata

运行方法:

Windows的 cmd命令行模式下 运行, 如下图红色框里,可以正确检测前面 text.jpg 图片里的英文内容。

tesseract 是命令

第一个目录是要识别的图片目录和文件名

第二个目录是结果要保存的目录和文件名

-l 是选项符号,(-后面那个小写字母是L的小写)

eng 是English的缩写,在目录 E:\Tesseract-OCR\tessdata目录下, 完整名称是下图的红色框内  eng.traineddata文件名。

makebox是固定的写法

注释:如果想要检测中文文字的图片,则需要下载 chi_sim.traineddata文件, 下载地址:https://github.com/tesseract-ocr/tessdata

注释: 如果以上GitHub打不开可以试试,CSDN的加速计划 https://codechina.csdn.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator

运行结果:

运行结果是一个 .box 文件, 可以用 文本类编辑工具软件打开或记事本打开 查看内容

结果是一行一个字母,如果图像比较干净,无干扰背景纹理的话,检测准确率很高。

Python 版本,没测试:可以参考:

https://zhuanlan.zhihu.com/p/113961004

https://blog.csdn.net/qq_41030861/article/details/99842001?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&dist_request_id=&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control

总结:

用于简单的图片,例如白底黑字,一行或者多行文字,字符直接比较松散,则检测结果质量较高,准确率较高。

若,图片中背景颜色很杂很多干扰因素,或者黑底白粗字,或者倾斜或者 其他门牌号广告牌等大字体,艺术字体,则几乎无法正确识别。 想要识别这些场景下的文字,则需要用深度学习神经网络模型,网上有很多开源软件,需要GPU伺候。

人工智能学习--文本识别实践-tesseract-ocr相关推荐

  1. 人工智能学习--文本检测实践

    注释:文本检测 和 文本识别是两回事. 可能现在已经有 end-to-end的深度神经网络可以将文本检测和识别一起实现,这个要去搜相关的sci论文. 文本检测,是从一张图片中找到文字区域,并用矩形框标 ...

  2. python opencv 文字识别_文本识别 使用 Tesseract 进行 OpenCV OCR 和 文本识别

    文本识别 用 Tesseract 进行 OpenCV OCR 和 文本识 在本教程中,您将学习如何应用OpenCV OCR(光学字符识别).我们将使用OpenCV,Python和Tesseract 执 ...

  3. 文本识别 使用 Tesseract 进行 OpenCV OCR 和 文本识别

    原文链接 文本识别 使用 Tesseract 进行 OpenCV OCR 和 文本识别 在 2019年7月18日 上张贴 由 hotdog发表回复 文本识别 用 Tesseract 进行 OpenCV ...

  4. 人工智能学习--文本检测和识别综述(2021)

    文本检测和文本识别可以分成两个部分: 目前的深度学习方案也有很多端到端的系统. 本质也是计算机视觉中的一种物体检测和识别分支: -- 传统方法用手工特征提取检测是否文本区域: 之后通过传统的机器学习方 ...

  5. 入门深度学习文本识别

    论文地址:https://arxiv.org/pdf/1507.05717v1.pdf 代码地址:GitHub - Holmeyoung/crnn-pytorch: Pytorch implement ...

  6. 深度学习文本识别之表格识别

    一.简介 实现简单的横竖表格图片的识别,提取表格并生成对应的Word文档 二.架构与部署 1.本项目为B/S架构 2.显示页面采用Python的web框架Django搭建页面,负责传入单张的表格图片 ...

  7. 人工智能学习--文本检测初探

    一.相关概念和综述: 转自知乎热心网友 燕小花女士的内容,供学习使用,若侵权则删.貌似写于2018年12月,之后这几年的流行方法更新,自行搜索sci顶刊和会议论文. https://zhuanlan. ...

  8. 个人永久性免费-Excel催化剂功能第86波-人工智能之图像OCR文本识别全覆盖

    在上一年中,Excel催化剂已经送上一波人工智能系列功能,鉴于部分高端用户的需求,再次给予实现了复杂的图像OCR识别,包含几乎所有日常场景,让公司个人手头的图像非结构化数据瞬间变为可进行结构化处理分析 ...

  9. 文本的检测、识别实战:使用 Tesseract 进行 OpenCV OCR 和文本识别

    在本篇文章中,我们将使用 OpenCV.Python 和 Tesseract 执行 (1) 文本检测和 (2) 文本识别. 上篇文章,我向您展示了如何使用 OpenCV 的 EAST 深度学习模型执行 ...

最新文章

  1. 增强包_机电工程学院开展“情暖冬日,爱在机电”冬至包饺子活动
  2. spark scala word2vec 和多层分类感知器在情感分析中的实际应用
  3. 深度:关于Linux内核最硬核的文章
  4. 使用Hadoop自带的例子wordcount实现词频统计
  5. python整数分节输出_pyfactor
  6. win10 Docker Toolbox 默认路径不能写问题
  7. 如何针对数据进行分析
  8. cookie读、写、删除
  9. 纯css3代码写九宫格效果
  10. 计算机软件著作权可以查询他人的源代码和申请材料吗?
  11. 拼接播放地址_杰和科技G330六屏拼接主机带来差异化6屏拼接方案
  12. 人造肉在中国还有未来吗?
  13. ZStack--级联框架
  14. java电话面试_记一次java电话面试
  15. 信息学奥赛一本通 1375:骑马修栅栏(fence) | 洛谷 P2731 [USACO3.3]骑马修栅栏 Riding the Fences
  16. 50 Projects 50 Days - Expanding Cards 学习记录
  17. c语言中i++与++i的区别
  18. SCP、NFS、TFTP的配置
  19. Linux网络编程基础API
  20. Python学习demo01 创建牌->洗牌->发牌->整理牌

热门文章

  1. svm通俗易懂的理解
  2. 服务器怎么查看数据库文件,怎么查看服务器上的数据库文件
  3. 2019小程序没必要做了_2019微信小程序的发展前景怎么样?有必要开发微信小程序吗?...
  4. python提取数据包中的文件_Python-对Pcap文件进行处理,获取指定TCP流
  5. system函数阻塞_CompletableFuture:让你的代码免受阻塞之苦
  6. python开发是不是苦累_Python 2.7 辛苦了,你好Python 3.7
  7. 第四十二篇 面对对象进阶
  8. TensorFlow学习入门
  9. PHP基础3--文件加载-错误处理
  10. windows socket----select模型