Python2.7利用Tesseract进行中英文图像识别
垃圾啊
背景环境: win8.1 64位 python2.7.13
本以为会很简单,结果在配置环境这块上花了很多时间,踩了几个坑,最后自己看英文文档和log才解决问题。
打开网站
https://pypi.python.org/pypi/pytesseract
https://github.com/tesseract-ocr/tesseract/wiki
https://github.com/tesseract-ocr/tesseract/wiki/Downloads
http://www.pythonware.com/products/pil/
找到并下载安装tesseract-ocr-setup-4.00.00dev.exe文件 下载中文训练库chi_sim.traineddata
将安装文件路径 添加到环境变量中的PATH 和 Path中去 ,在系统变量中添加一个TESSDATA_PREFIX,变量值还是文件路径
我的是D:\programfiles\tesseract\Tesseract-OCR
打开cmd安装 pip install pytesseract
去C:\Python27\Lib\site-packages 下找到PIL卸载 然后 去下载 PIL-1.1.7.win32-py2.7.exe 并安装
# -*- coding: utf-8 -*-
try:import Image
except ImportError:from PIL import Image
import pytesseractimg = Image.open('test2.png')
img.load()
text = pytesseract.image_to_string(img, lang='chi_sim')
print(text)
最后找张png的图放在和这个文件同目录下 完事了
几个坑:
:from . import VERSION, PILLOW_VERSION, _plugins ueError: Attempted relative
不知道什么鬼,后来直接把C:\Python27\Lib\site-packages\PIL 给删了 重新安装这个库
pytesseract.pytesseract.TesseractError: (1, u'Error opening data file D:\\programfiles\\tesseract\\Tesseract-OCR/chi_sim.traineddata')
这里需要将chi_sim.traineddata放在指定目录下,而不是 $path\tessdata\tessconfigs下
总结: 看官方教程 百度上搜索的太旧了 stackoverflow 也是
I'm fish, I'm on.
Python2.7利用Tesseract进行中英文图像识别相关推荐
- 利用模型算法部署图像识别_利用这些技巧增强您的图像识别模型
利用模型算法部署图像识别 So, you have gathered a dataset, built a neural network, and trained your model. 因此,您已经 ...
- 使用计算机来进行翻译是,利用计算机进行中英文翻译的探讨
- 229 - 校园英语 / 翻译研究 利用计算机进行中英文翻译的探讨 宁夏大学外国语学院/来友昊 [摘要]随着近年来科技的快速发展,针对于传统的人工翻 译方式,相关的研究人员已经可以使用计算机的相关 ...
- python 识别图片中的中文_Python中利用Tesseract软件来识别图片中的英文与中文
OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...
- python图片显示英文字符_Python中利用Tesseract软件来识别图片中的英文与中文
OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...
- Java利用正则表达式实现中英文日期转换函数封装
前言: Java利用正则表达式实现中英文日期互相转换函数封装,一共实现了6个方法(封装的原因是因为在Android中使用SimpleDateFormat 太麻烦了,各种try catch excep ...
- 测试一些利用PYTHON完成中英文翻译的效果
简 介: 测试了一些在线翻译工具的效果,利用有道翻译 可以方便对常见到的生词进行确认.对于 TEASOFT软件PYTHON功能进行改建,给出了 ?>的翻译模式功能. 关键词: 在线翻译,中英文翻 ...
- 利用 tesseract 自动识别图片中的文字
一.tesseract 下载 tesseract 下载地址:Index of /tesseract 我用的是 4.0 版本,对应的如图中下载链接 下载后双击安装,一路 next,一定要记住自己的安装路 ...
- 使用计算机翻译的是,利用计算机进行中英文翻译的探讨
[摘要]随着近年来科技的快速发展,针对于传统的人工翻译方式,相关的研究人员已经可以使用计算机的相关翻译软件来对相关文字进行翻译,真是因为计算机翻译技术的提升,使得整体翻译水平正在进行一个高科技带动下的 ...
- 我们能用计算机来计算用英文,利用计算机进行中英文翻译的探讨
[摘要]随着近年来科技的快速发展,针对于传统的人工翻译方式,相关的研究人员已经可以使用计算机的相关翻译软件来对相关文字进行翻译,真是因为计算机翻译技术的提升,使得整体翻译水平正在进行一个高科技带动下的 ...
最新文章
- mysql如何导入JSON数据-navigate管理数据库,导入JSON数据不显示。需要整体关闭再打开!
- 企业命令linux下处理实时日志生成另一个实时日志
- 归并排序相关题目(待编辑)
- anaconda配置虚拟环境
- Java FilePermission暗含()方法与示例
- projecteuler_介绍#ProjectEuler100挑战:编码成就的“黑暗灵魂”
- JAVA-SWING:生成透明JTable的改进2
- 硬盘格式化了的数据找到办法
- 浙江农林大学蓝桥杯程序设计竞赛校选拔赛(同步赛)签到题ABFGHIJ
- Bridge的VLAN接口模式
- 2023年华中科技大学金融专硕考研参考书、难度分析及备考经验
- 给UILabel中的文字加删除线
- 程序员希望收到什么礼物
- php theexcerpt,WordPress:the excerpt(摘要)
- ArcGIS三维分析之ArcGlobe简要说明
- 《Excel视频3》打印
- android字体中间横线,Android TextView(EditView)文字底部或者中间 加横线
- 轻量级UPF N4接口开放性技术研究与应用
- 使用echarts实现雷达图
- 38、EST序列拼接流程
热门文章
- LDPC Codes in 5G- 05 : BG, 扩展因子Z
- Oracle视图授权(with grant option)
- HDFS(一)HDFS基本介绍
- 延迟消息解决方案总结(含源码)
- label和fieldset标签
- K - Kangaroo Puzzle Gym - 101981K (随机+乱搞)
- Stearic acid-mPEG,mPEG-STA,甲氧基PEG-单硬脂酸,具有优异疏水性
- DataTable使用详解,kettle详细使用教程
- Vue+iview 密码框输入显示隐藏控制
- “ARTS挑战:探索技术,分享思考“