Tesseract-OCR 是一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎。与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。

一、环境配置

1、下载

Index of /tesseract

我下载了最后一个最新的,下载完成直接安装。

2、环境变量配置

为了在任意终端可以使用,需配置环境变量。

在用户变量和系统变量的Path中添加ocr的安装路径。

 3、中文环境配置

要是中文环境不能用,打开tessdata_fast ,下载简体中文包。

将下载好的文件复制到安装目录下的tessdata文件夹中。

二、测试

1、测试文件准备

网上随便截了张图放在下面文件夹。

2、测试过程

在此文件夹执行cmd命令,回车,弹出终端。

在弹出的终端中输入以下命令。

tesseract 图片 要保存文件名 -l 中文包tesseract test.png 中文测试 -l chi_sim

执行完成,在图片所在目录生成txt文件。

3、查看结果

准确度还可以。

tesseract-ocr中文识别相关推荐

  1. 关于Tesseract OCR 中文训练识别小试(java调用Tess4j)

    2017.9.20日小结 最近接到是关于消防系统协议解析仪器的项目,目的是从协议解析仪器获取有效数据,并解析数据(目的是不希望消防主机的数据信息再传给主机厂商而是最后能给自己收集调用).由于各个消防器 ...

  2. Tesseract Ocr文字识别实战(新版本,扩展手写文字识别)

    目录 1.Tesseract Ocr文字识别 1.1 运行环境 1.2 python模块 1.3 配置tesseract运行文件 1.4 代码识别 2. 手写汉字识别 2.1 下载库 2.2 代码 1 ...

  3. PaddleHub一键OCR中文识别 身份证识别

    环境安装:PaddleHub一键OCR中文识别:https://aistudio.baidu.com/aistudio/projectdetail/512888 开源代码:https://github ...

  4. iOS实践:OpenCV、Tesseract OCR结合 识别图片中文字

    前言: 前天领导问,类似扫描文件识别图中文字的功能如何实现,找一下第三方的开源库,尝试下,于是有了这篇文章: 分析: 识别场景中,识别身份证信息当属典型,查阅了几篇文章,后续的实现中也多导入了其代码: ...

  5. python ocr中文识别库 tesseract安装及问题处理

    这个破东西,折腾了快1个小时,网上的教材太乱了. 我解决的主要是windows的问题 先下载exe.(一看到这个,我就有种预感,不妙) https://digi.bib.uni-mannheim.de ...

  6. Tesseract Ocr文字识别

    Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一.2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于G ...

  7. 用paddleocr识别汉字_(暑期实践)PaddleHub一键OCR中文识别

    前要 飞桨首次开源文字识别模型套件PaddleOCR,目标是打造丰富.领先.实用的文本识别模型/工具库.首阶段的开源套件推出了重磅模型:8.6M超轻量中英文识别模型.该超轻量模型由1个文本检测模型(4 ...

  8. 【Tesseract-OCR】玩转OCR中文识别

    无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.点这里可以跳转到教程.人工智能教程 一.准备工作: 1 ...

  9. 【毕业设计】深度学习OCR中文识别系统 - opencv python

    文章目录 0 前言 1 课题背景 2 实现效果 3 文本区域检测网络-CTPN 4 文本识别网络-CRNN 5 最后 0 前言

  10. deep_ocr 是使得 OCR 比 tesseract 更好的中文识别、身份证识别等等

    deep ocr 估计很多开发员使用tesseract做中文识别,但是结果不是一般的差,譬如下面的图片 $ tesseract -l chi_sim test_data.png out_test_da ...

最新文章

  1. PyTorch-Adam优化算法原理,公式,应用
  2. HDU1531(差分约束+Bellman_ford)
  3. golang语言学习第三课 条件语句
  4. python自动化干什么-Python接口自动化测试(一)什么是接口?
  5. 【转载】说说大型高并发高负载网站的系统架构
  6. 信号、系统与滤波器设计(matlab)
  7. php底层实现也是c语言,深入php内核,从底层c语言剖析php实现原理
  8. Win7系统中用anaconda配置tensorflow运行环境
  9. matlab求逆矩阵_MPU6050姿态解算2-欧拉角amp;旋转矩阵
  10. 拿到串口的数据如何解析_大数据解析如何租到“物美价廉”的好房?
  11. 写入多个表_制作属于自己的教学工作表
  12. 书------编程书(FoxPro)
  13. 天锐绿盾解密_天锐绿盾数据防泄密系统
  14. 【数据治理】数据治理工具-元数据管理
  15. Android 进阶——系统启动之核心SystemServer进程启动详解(七)
  16. 如何用wps自动生成目录,你学会了吗?
  17. java中国象棋棋子走法,《中国象棋对弈》象棋规则 棋子的走法
  18. 在android tegra2中添加一个camera
  19. 弘辽科技:胡润研究院发布《2020胡润中国10强电商》榜单,第二名很意外
  20. 期货客户开户手续费(期货开户最低手续费)

热门文章

  1. Python脚本使用CDSAPI批量下载ERA5气象数据
  2. dc调光模块0-10V转0-100mA/1A/2A/比例阀隔离变送器
  3. 研发团队如何低成本实现敏捷开发管理
  4. web大屏展示用到的组件_可视化大屏如何实现?怎样对接开发?看这就对了!
  5. 使用虚拟磁盘管理软件详细介绍
  6. 京东API接口,Onebound数据
  7. winpcap的VC6.0运行环境配置
  8. 10. Redis数据类型--Geospatial
  9. phpspreadsheet生成Excel表格
  10. Vivado初学笔记