一、安装库

首先我们需要安装PIL和pytesseract库。
PIL:(Python Imaging Library)是Python平台上的图像处理标准库,功能非常强大。
pytesseract:图像识别库。

我这里使用的是python3.6,PIL不支持python3所以使用如下命令

pip install pytesseract
pip install pillow

如果是python2,则在命令行执行如下命令:

pip install pytesseract
pip install PIL

这时候我们去运行上面的代码会发现如下错误:

错误提示的很明显:
No such file or directory :"tesseract"

这是因为我们没有安装tesseract-ocr引擎

二、tesseract-ocr引擎

光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。OCR技术非常专业,一般多是印刷、打印行业的从业人员使用,可以快速的将纸质资料转换为电子资料。关于中文OCR,目前国内水平较高的有清华文通、汉王、尚书,其产品各有千秋,价格不菲。国外OCR发展较早,像一些大公司,如IBM、微软、HP等,即使没有推出单独的OCR产品,但是他们的研发团队早已掌握核心技术,将OCR功能植入了自身的软件系统。对于我们程序员来说,一般用不到那么高级的,主要在开发中能够集成基本的OCR功能就可以了。这两天我查找了很多免费OCR软件、类库,特地整理一下,今天首先来谈谈Tesseract,下一次将讨论下Onenote 2010中的OCR API实现。可以在这里查看OCR技术的发展简史。
Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封。
数年以后,HP意识到,与其将Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生--2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。

###安装tesseract-ocr引擎

brew install tesseract

然后我们通过tesseract -v看一下是否安装成成功

tesseract 3.05.01
leptonica-1.75.0
libjpeg 9b : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11

这时候我们运行上面代码会出现乱码

这是因为tesseract默认只有语言包中没有中文包,如下图:

###安装tesseract-ocr语言包
我们去GitHub下载我们需要的语言包,这里我只下载了chi_tra.traineddatachi_sim.traineddata
github:tesseract-ocr/tessdata
然后放到/usr/local/Cellar/tesseract/3.05.01/share/tessdata路径下面。

可以通过tesseract --list-langs查看本地语言包:

可以通过tesseract --help-psm 查看psm

0:定向脚本监测(OSD)
1: 使用OSD自动分页
2 :自动分页,但是不使用OSD或OCR(Optical Character Recognition,光学字符识别)
3 :全自动分页,但是没有使用OSD(默认)
4 :假设可变大小的一个文本列。
5 :假设垂直对齐文本的单个统一块。
6 :假设一个统一的文本块。
7 :将图像视为单个文本行。
8 :将图像视为单个词。
9 :将图像视为圆中的单个词。
10 :将图像视为单个字符。

为什么这里要强调语言包和psm,因为我们在使用中会用到,
比如多个语言包组合并且视为统一的文本块将使用如下参数:
pytesseract.image_to_string(image,lang="chi_sim+eng",config="-psm 6")
这里我们通过+来合并使用多个语言包。

接下来我们看一下配置好一切的正确结果。

import pytesseract
from PIL import Imageimage = Image.open("../pic/c.png")
code = pytesseract.image_to_string(image,lang="chi_sim",config="-psm 6")
print(code)

此时大公告成。

~~号外~~福利~~号外~~
程序员的福音: “老曾筋骨祛痛贴”,百年祖传配方,专治腰间盘肩周颈椎坐骨神经腰腿疼痛等,博主亲测效果非常棒,因长期久坐写代码,坐姿不规范导致脖子疼,腰椎疼,用过之后疼痛逐渐缓解,现在已无任何疼痛,用过后让你写代码一身轻松,so easy,妈妈再也不用担心我们写代码了。

扫码下方二维码,关注公众号“伟大程序猿的诞生“,回复“膏药”领取优惠券,进行购买
扫码关注公众号“伟大程序猿的诞生“,更多干货新鲜文章等着你~

公众号回复“资料获取”,获取更多干货哦~

有问题添加本人微信号“fenghuokeji996” 或扫描博客导航栏本人二维码

我的博客即将同步至腾讯云+社区,邀请大家一同入驻:
https://cloud.tencent.com/developer/support-plan?invite_code=ncnq0hloo5yw

python人工智能-图像识别相关推荐

  1. Python(TensorFlow框架)实现手写数字识别系统python人工智能-图像识别

    一.安装库 首先我们需要安装PIL和pytesseract库. PIL:(Python Imaging Library)是Python平台上的图像处理标准库,功能非常强大. pytesseract:图 ...

  2. python人工智能图像识别_人工智能之Python人脸识别技术,人人都能做识别!

    原标题:人工智能之Python人脸识别技术,人人都能做识别! 作者丨Python小哥哥 https://www.jianshu.com/p/dce1498ef0ee 一.环境搭建 1.系统环境 Ubu ...

  3. python 智能识别 超市商品 python人工智能 图像识别可以检测图片,视频流,有界面

    随着社会经济的发展,选择到超市购物的消费者越来越多,超市排长队付账的矛盾也越来越突出.对此,我们提出一种新型的购物车,通过识别商品录入同时放入购物车中,并利用检测系统检测是否与已知的商品信息相匹配,并 ...

  4. python人工智能图像识别视频下载链接_2019-07-11 人工智能-图像识别项目分析-基于tensorflow的视频物品检测...

    选题:基于tensorflow的视频物品检测 Real-Time Object Recognition App with Tensorflow and OpenCV 一个实时对象识别应用程序 1.准备 ...

  5. [Python人工智能] 三.TensorFlow基础之Session、变量、传入值和激励函数

    从本篇文章开始,作者正式开始研究Python深度学习.神经网络及人工智能相关知识.前一篇文章讲解了TensorFlow基础和一元直线预测的案例:本篇文章将详细介绍Session.变量.传入值和激励函数 ...

  6. [Python人工智能] 二.TensorFlow基础及一元直线预测案例

    从本篇文章开始,作者正式开始研究Python深度学习.神经网络及人工智能相关知识.前一篇文章讲解了TensorFlow的安装过程和神经网络基础概念.这篇文章将分享TensorFlow基础并介绍一元直线 ...

  7. [Python人工智能] 一.TensorFlow环境搭建及神经网络入门

    从本篇文章开始,作者正式开始研究Python深度学习.神经网络及人工智能相关知识.第一篇文章主要讲解神经网络基础概念,同时讲解TensorFlow2.0的安装过程及基础用法,主要结合作者之前的博客和& ...

  8. [Python人工智能] 三.theano实现分类神经网络及机器学习基础

    从本篇文章开始,作者正式开始研究Python深度学习.神经网络及人工智能相关知识.前两篇文章讲解了神经网络基础概念.Theano库的安装过程及基础用法.theano实现回归神经网络,这篇文章主要讲解机 ...

  9. Python人工智能基础到实战课程-北方网视频

    ** Python人工智能基础到实战课程 ** 课程主要分为6大模块,带领大家逐步进步人工智能与数据科学领域. 第一阶段:Python语言及其数据领域工具包使用 本阶段旨在帮助大家快速掌握数据领域最常 ...

  10. 近期风靡互联网的Deep Dream人工智能图像识别软件

    code: https://github.com/google/deepdream/blob/master/dream.ipynb 声明:本译文包含六篇以上原外文内容,现汇合一处,附有大量的链接.实际 ...

最新文章

  1. HDLBits 系列(11)All about Adder
  2. ethz ‘s choice for graduate studies
  3. python将object转换为float_将pandas系列类型从object转换为float64
  4. 类方法的实例python_Python Class 的实例方法/类方法/静态方法
  5. leetcode python 011
  6. sql server 日期类型
  7. 【架构师培训课程-技术基础课】
  8. python二维数组切片_python语言多维数组切片方法
  9. 数据包络分析CCR、BCC模型
  10. ios appstore 上架应用被拒绝原因
  11. 如何生成希尔伯特矩阵
  12. 加拿大签证材料(一家三口)
  13. 北京理工大学计算机学院ppt,北京理工大学计算机学院2015级4班德育开题展示报告.ppt...
  14. 改文件777的php,服务器文件目录权限777修改方法
  15. STM32cubemx教程 DAC+TIM+DMA
  16. K8S——存储-Secret
  17. 最火后台管理系统 RuoYi 项目探秘,之二
  18. proto2java
  19. 实战:618/双11大促备战全流程点点滴滴
  20. J2EE疑难解决实例--转自JSP中文网

热门文章

  1. 如何从Java官网下载 Java API 文档
  2. Docker最新超详细版教程通俗易懂(基础版)
  3. 云南 代理服务器_今日更新快速ip代理服务地址 免费国外代理服务器 2013.4.17
  4. Delphi7 动态数组
  5. 2022-08-26 Unity视频播放3——VideoPlayer
  6. python语法简洁清晰、特色之一是强制用作为语句缩进_问道python之基础篇【一】 认识python...
  7. Bulk insert远程服务器导入sqlserver
  8. linux系统的实时性,Linux操作系统实时性
  9. C语言 饭卡管理系统
  10. 全志r16android sdk,全志 Allwinner R16 SoC 全套设计资料分享 原理图 PCB 数据手册 SDK...