官方网站:https://github.com/tesseract-ocr/tesseract
官方文档:https://github.com/tesseract-ocr/tessdoc
语言包地址:https://github.com/tesseract-ocr/tessdata
下载地址:https://digi.bib.uni-mannheim.de/tesseract/

1 基本环境

操作系统:win10 64位系统

python版本:3.6

2 安装配套环境

(1)首先安装OCR字符识别库Tesseract    下载网址:Index of /tesseract

下载下图对应的版本(如下图所示)

下载后双击进行安装,在这里(如下图)要根据需求在安装界面进行语言勾选,展开Additional language data

然后按照下图进行勾选(本人选择的是中文)

然后点击next安装即可(注意:在选择安装路径的时候不要出现中文,并且要记住这个安装路径)。我的路径为:

D:\Tesseract-OCR

接下来配置环境变量。

通过控制面板找到环境变量配置界面如下(找不到环境变量配置的自行百度):

分别对用户变量PATH和系统变量Path添加刚才的安装目录  D:\Tesseract-OCR;

环境变量修改好之后验证下是否安装成功。打开cmd命令行工具   敲入命令:

Tesseract -v

出来如下界面说明成功

(2)安装python环境

pip install Pillow==5.2.0
pip install pytesseract==0.2.4

3 测试

将以下图片保存为OCR_test.png,然后放在桌面上

在cmd窗口中执行 tesseract test.jpg test.txt –l chi_sim+eng(chi_sim是中文识别包,equ是数学公式包,eng是英文包),即可将图片中的文字识别出来

tesseract OCR_test.png OCR_test –l chi_sim+eng

效果图如下:

基于python的OCR字符识别相关推荐

  1. python如何ocr_基于Python的OCR实现示例

    摘要: 近几天在做一个东西,其中需要对图像中的文字进行识别,看了前辈们的文章,找到两个较简单的方法:使用python的pytesseract库和调用百度AI平台接口.写下这篇文章做一个比较简短的记录和 ...

  2. python实现ocr识别算法_基于Python的OCR实现示例

    摘要: 近几天在做一个东西,其中需要对图像中的文字进行识别,看了前辈们的文章,找到两个较简单的方法:使用python的pytesseract库和调用百度AI平台接口.写下这篇文章做一个比较简短的记录和 ...

  3. 简单实用的基于python的OCR中文字符识别——基于windows平台(附代码)

    1. 基本环境 操作系统:win7 64位系统 python版本:3.6 2.安装配套环境 (1)首先安装OCR字符识别库Tesseract    下载网址:https://digi.bib.uni- ...

  4. 基于Python的OCR图像识别

    前言 由于目前做的项目里面有些地方的需要用到图像文字识别,因此在此总结下,以下方法适合新手 1.使用python的pytesseract库 主要是安装库,比较简单,直接使用 pip install 安 ...

  5. 基于python的OCR图像识别,EasyOCR图像处理文字识别

    最近在做ocr图像识别,试过了好多种,其中EasyOCR模块还是可以满足基本的图像识别的,下面,写一写使用的方法,一是供大家参考,二也是自己做个备注笔记,另外,EasyORC是个开源的项目,免费的 1 ...

  6. 【优秀课设】基于Python的百度API的OCR名片识别【含完整API账户】

    基于Python的百度API的OCR名片识别[含完整API账户] API账户:(AK及SK) client_id ='WiXDt5e70NI5w0qSeoUBZClZ' client_secret = ...

  7. python 高精度时间_如何基于Python代码实现高精度免费OCR工具

    近期Github开源了一款基于Python开发.名为Textshot的截图工具,刚开源不到半个月已经500+Star. 这两天抽空看了一下Textshot的源码,的确是一个值得介绍的项目. 相对于大多 ...

  8. 基于Python的离线OCR图片文字识别(一)——命令行方式对图像文件处理生成同名txt文件

    应用背景:在正式开始文章之前,先阐述一下项目的应用背景--项目需要对已有的电子档案数据进行"大数据"处理和呈现,但是由于之前进行档案电子化时都是以扫描文件的图像格式存储在硬盘上(准 ...

  9. 基于Python的简单验证码识别

    原文链接:有图有真相 摘要:验证码在网络安全方面发挥着关键作用,验证码的主要目的是区分人类和计算机,用来防止自动化脚本对网站的一些恶意行为.目前绝大多数网站都利用验证码来阻止恶意脚本程序的入侵.验证码 ...

最新文章

  1. Python库glob学习笔记
  2. Error in **** : non-numeric argument to binary operator
  3. 007_html头部元素
  4. 渥太华大学计算机工程,渥太华大学电气与计算机工程硕士专业.pdf
  5. TCP报文发送的那些事
  6. 【Python学习】 - 使用PIL, cv2, keras.preprocessing, scipy.imageio, matplotlib.image, skimage读取和保存图像的方法
  7. java 耦合度_Java第三十八天,Spring框架系列,使用工厂模式降低程序耦合度
  8. 使用Java的BlockingQueue实现生产者-消费者
  9. Android 解决ViewPager双层嵌套的滑动问题
  10. Leetcode 101.对称二叉树
  11. zookeeper 分布式锁_详细讲解!从秒杀聊到ZooKeeper分布式锁
  12. 国资入局,苏宁“零售服务商”升级战略获得最强助力
  13. 如何在Microsoft Excel电子表格之间交叉引用单元格
  14. 最大约数(秋季每日一题 34)
  15. 迅雷thunder://地址与普通url地址转换
  16. Linux常用指令---系统负载
  17. 每个程序员都应该了解的 CPU 高速缓存 英文原文:Memory part 2: CPU caches
  18. L1-norm (L1范数) L2-norm(L2范数)
  19. 【Linux】 设置支持中文 | 全局
  20. 如何编程访问(读,写)Revit项目信息

热门文章

  1. Android Studio App开发之使用摄像机录制视频和从视频库中选取视频的讲解及实战(附源码)
  2. requests的介绍(python的第三方HTTP请求库)
  3. Linux下使用system函数获取命令执行返回结果
  4. Windows给力!可以扔掉Linux虚拟机了!
  5. Bugku ez_misc WriteUp
  6. C语言标准及C标准库、运行时库简介
  7. json jsono wsdl_javascript中JSON是干嘛的?谁能形象通俗的说一下,本人小白 O.O!
  8. 超详细配置教程,搭建Windows深度学习环境
  9. tengine mysql_[原创]Tengine与tengine 配置参数详解
  10. webbench 下载_webbench压力测试