本篇文章主要参考了 python图像处理之识别图像中的文字 这篇文章,在实现的过程中出现了些偏差,特此记录。因为此时笔者不是第一次安装,所展示的结果会和首次安装的结果有所差别。

1.安装PIL

以管理员的身份打开命令提示符,输入:pip install pillow.

(注:PIL是python平台事实上的图像处理标准库,但PIL仅支持到python2.7,加上年久失修,于是在PIL的基础上创建了兼容的版本pillow,支持最新的python3.X。)

2.安装pytesser3

打开命令提示符,输入:pip install pytesser3

3.安装pytesseract

打开命令提示符,输入:pip install pytesseract

4.安装autopy3

先安装wheel,即先在命令提示符中输入pip install wheel。

下载autopy3-0.51.1-cp36-cp36m-win_amd64.whl。点击此处下载,此时该文件所在目录为D:\liuyan\autopy3-0.51.1-cp36-cp36m-win_amd64.whl。

在命令提示符中输入: pip install D:\liuyan\autopy3-0.51.1-cp36-cp36m-win_amd64.whl

5.安装Tesseract-OCR

5.1 下载安装包

百度搜索Tesseract-OCR下载   Tesseract-orc-setup-3.02.02.exe   。要记得自己的安装目录(博主的安装路径为:C:\Program Files(x86)\Tesseract-OCR),等会配置环境变量要用。

如果不是做英文的图文识别,还需要下载其他语言的识别包  其他语言各版本的识别包下载  ,如简体字识别包对应的是chi_sim.traineddata ,繁体字识别包对应的是chi_tra.traineddata 。

5.2 安装

具体安装步骤可参考光学字符识别引擎Tesseract-ocr安装过程 。

5.3 配置环境变量

博主的安装路径为:C:\Program Files(x86)\Tesseract-OCR。电脑属性--高级系统设置--环境变量,进入如下界面。

把刚刚的安装路径"C:\Program Files(x86)\Tesseract-OCR"添加到用户变量和系统变量的path中,注意,添加的时候开头用";"跟之前的变量隔开,以";"结尾。配置好后点击确定。

打开命令终端,输入:tesseract -v,可以看到版本信息。

到这里,我们就算安装完成了。但是,我们的系统还是无法识别中文的,要去下载简体汉字、繁体汉字语言包(其他语言各版本识别包下载),下载好之后放到安装目录的tessdata目录下即可。

注:此处的安装过程参考Window环境安装tesseract-ocr 4.00并配置环境变量  。

5.4 验证是否安装成功

进入cmd窗口,敲入命令cd C:\Program Files (x86)\Tesseract-OCR,再输入tesseract,若有如下信息则表示安装成功。

还可以用命令tesseract --list-langs来查看Tesseract-OCR支持的语言。

入门使用

window中运行tesseract(参考 OCR开源软件Tesseract的下载和入门使用)

1.tesseract是一个命令行OCR程序,打开一个终端(Win+R),输入语法如下:

tesseract 输入图片的文件名 输出文件的文件名 [-l lang][-psm pagesegmode][configfile...]

例如:识别 微信图片5.png 图像,将识别结果存入 out2.txt,如下

2.用pycharm进行图像中的汉字识别

要识别的原图如下:(来自小华的《烟火里的尘埃》)

实现的代码如下:

import  pytesseract
from PIL import Image
im=Image.open(r'C:\Users\名字被抢了\desktop\图片2.png')
print(pytesseract.image_to_string(im,lang='chi_sim'))

效果图

识别的效果不是很好,有待于进一步提高正确率。

python--识别图片中的文字相关推荐

  1. 如何用Python识别图片中的文字?

    如何用Python识别图片中的文字? 转:https://mp.weixin.qq.com/s/wXDJoAAI8y1mtbUuwATngQ 以下文章来源于微信公众号:新建文件夹X ,作者ZackSo ...

  2. 用 Python 识别图片中的文字

    一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存.但是当我们想用到里面的 ...

  3. python批量识别图片中文字_如何用Python识别图片中的文字?

    一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存.但是当我们想用到里面的 ...

  4. python保存图片到指定路径_用 Python 识别图片中的文字

    (给Python开发者加星标,提升Python技能) 来源:ZackSock 一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度 ...

  5. python识别图片文字_如何利用Python识别图片中的文字

    一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存.但是当我们想用到里面的 ...

  6. python识别图片上的文字_怎么用python识别图片中的文字-百度经验

    在网上看了很多用python进行文字识别的文章,就只有两个字的体会:乱.差.因为很多模块,我都不知道怎么安装,弄得焦头烂额,反而因此浪费了很多时间,而且到最后也是没能成功. 在文章中插入大量BUG,让 ...

  7. python识别汉字笔画_Python识别图片中的文字

    Python识别图片中的文字 一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截 ...

  8. python识别图片上的文字_Python如何识别图片中的文字 【转】

    Python如何识别图片中的文字,这里给个案例并附上详细步骤: 模块包的安装: 1.安装PIL:pip install Pillow 2.安装pytesser3:pip install pytesse ...

  9. python如何识别中文_python如何识别图片中的文字

    python如何识别图片中的文字,这里给个案例并附上详细步骤: 模块包的安装: 1.安装PIL:pip install Pillow 2.安装pytesser3:pip install pytesse ...

  10. python 图片识别_Python—识别图片中的文字

    一.前言 不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存.但是当我们想用到里面的 ...

最新文章

  1. php 编译安装降解,对php编译安装的修正
  2. javaweb学习总结(十九)——JSP标签
  3. 【电设控制与图像训练题】【激光打靶】【opencv测试代码以及效果】
  4. HTML 使用jQuery选中复选框 简易版
  5. 深度学习(三十六)异构计算CUDA学习笔记(1)
  6. Eclipse 下如何引用另一个项目的Java文件
  7. PyQt学习--HelloWorld
  8. HDU1847 Good Luck in CET-4 Everybody!【SG函数】
  9. Vivado HLS教程
  10. 学习计算机组装与维护的意义,学习计算机组装维护的目的与心得体会!
  11. Android WebView 播放视频无法播放问题和视频适应屏幕大小
  12. 通讯录总结-JAVA GUI- “婉君被通讯录吓晕”-第一版
  13. Excel的图表:组成元素、图表类型与用途、图表可视化大全
  14. 用Java实现,把Byte,相应的转换为KB,MB,GB,TB
  15. 第一章 ArcGIS Pro python高级脚本教程介绍
  16. 第2部分 字符串算法(提高篇)--第2章 KMP算法1469:似乎在梦中见过的样子
  17. WinForm引用ActiveX组件,对Com组件的学
  18. iis6.0的网站建设及权限设置
  19. wifi信号放大器除了易拉罐,还有免费wifi软件
  20. Twitter Typeahead plugin Example

热门文章

  1. 浅谈智能消防疏散应急照明系统在高层建筑的设计与应用
  2. 【独家】华为OD机试 - 去重求和(C 语言解题)
  3. springboot + flowable + idm 在线编辑器
  4. 使用 Copilot 编写和翻译二分查找算法
  5. LinkedList(JDK1.8)源码解析
  6. Python阶乘求和
  7. FutureWarning: elementwise comparison failed; returning scalar instead, but in the future will perfo
  8. ubuntu18.04无法联网解决
  9. JavaScript 转盘类型抽奖代码
  10. c语言强制退出for循环,在vb中用于强制退出for循环的语句是什么。