目录

  • 一、安装
  • 二、配置
  • 二、测试
    • 1. 命令行测试
    • 2. 代码测试

一、安装

https://github.com/tesseract-ocr/tesseract

下载安装包:tesseract-ocr-setup-4.00.00dev.exe

下载语言包: chi_sim.traineddata,eng.traineddata

二、配置

(1)配置环境变量 TESSDATA_PREFIX=D:\tools\Tesseract-OCR\tessdata

(2)配置环境变量:path中添加 D:\tools\Tesseract-OCR

(2)将语言包放在安装目录 D:\tools\Tesseract-OCR\tessdata

二、测试

测试图片如下:

1. 命令行测试

再图片目录下,打开cmd窗口

tesseract test.jpg test -l chi_sim

如果翻译英文,则执行命令:

tesseract test.jpg test -l eng

结果:生成test.txt

2. 代码测试

引入依赖

<!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j -->
<dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>4.5.4</version>
</dependency>
public static void main(String[] args) {String imagePath = "C:\\Users\\x\\Desktop\\img\\test.jpg";try {BufferedImage textImage = ImageIO.read(new File(imagePath));Tesseract instance = new Tesseract();//设置语言包路径instance.setDatapath("D:\\tools\\Tesseract-OCR\\tessdata");//设置训练库//设置中文识别instance.setLanguage("chi_sim");String result = instance.doOCR(textImage);System.out.println(result);} catch (Exception e) {}}

结果:

java图片文字识别tesseract-ocr相关推荐

  1. 【图片识别】java 图片文字识别 ocr (转)

    http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...

  2. android自动识别文字,Android文字识别tesseract ocr -训练样本库 识别字库

    目录 安装tesseract ocr引擎和jTessBoxEditor 安装jTessBoxEditor 开始制作box 准备好训练的图片 将图片转为tif格式的样本图片 合并样本图片 修改box文件 ...

  3. python 离线图片文字识别(OCR)Tesseract

    本人最近也是在使用和学习python遇到各种问题,公司内网控制严格 没有网络,同时也不允许安装exe文件,做python 十分的费劲,也研究了好几款文字识别的OCR ,要么是收费的 要么是离线不能用, ...

  4. python文字识别算法_Python图像处理之图片文字识别(OCR)

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  5. java图片文字识别功能的实现

    1安装C++运行库 2设置环境变量 TESSDATA_PREFIX F:\tessdata 3依赖 <dependency>             <groupId>net. ...

  6. 阿里云 OCR 图片文字识别接口使用案例(java)

    阿里云 OCR 图片文字识别接口使用案例(java) 阿里云官方接口文档 前期需要完成 购买阿里云服务 购买服务 可以购买测试服务.每个阿里云用户可以购买1次免费的500次接口请求进行测试 购买完成之 ...

  7. python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...

    0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...

  8. python图像识别系统_Python图像处理之图片文字识别功能(OCR)

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  9. python文字识别时、当文字不清晰时怎么处理_Python图像处理之图片文字识别功能(OCR)...

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

最新文章

  1. printf 指针地址_c语言入门 第十四章指针
  2. python logging日志模块的使用
  3. 轮廓的查找、表达、绘制、特性及匹配(How to Use Contour? Find, Component, Construct, Features Match)
  4. Spring 3 MVC深入研究
  5. zoj1095 Humble Numbers(DP)
  6. 推荐一个JavaScript触发器插件,可通过指定频次、指定时间内触发指定的处理函数...
  7. VC第三方界面库xtremetoolkitPro使用说明
  8. html 自适应 音乐播放器,mmPlayer:一款基于Vue的自适应Web在线音乐播放器
  9. 字节面试杂谈——操作系统
  10. 输入一个4位以内的正整数,输出各位数字之和
  11. 响铃:社交型流量平台,为何线上平台都扎堆去线下造节
  12. 通过银行卡号获取银行卡所属银行
  13. 黑魂向project制作学习三:摄像头碰撞(Camera Collisions)
  14. 刚体“下落速度“与“质量“无关
  15. windows批处理批量更改文件名称
  16. VMware下载安装WIN7虚拟机
  17. liquibase(数据库管理)
  18. 类和对象的定义和关系
  19. 仿抖音底部菜单响应式html代码十分酷炫
  20. 抖音xlog算法 bqq 以及各个参数的解释以及如何突破风控注册账号和点赞关注

热门文章

  1. 计算机毕业设计JAVA基于的校园头条新闻管理系统的设计与实现mybatis+源码+调试部署+系统+数据库+lw
  2. Snowflake Snow Snowflakes(hash)
  3. 安全漏洞中的屠龙刀——SQL注入
  4. 纵向输出字符串python_python字符串(转义字符)_1.05
  5. SCJ-LL01 多普勒超声波流量计(多普勒超声波明渠流量计)
  6. 3d效果之旋转的球形
  7. 流水线-阿里云镜像仓库
  8. 【python圣诞树】圣诞节来了,还不快给女友来画一棵属于她的圣诞树
  9. 这个是怎么回事?求解 图片加载不出来
  10. SRGAN With WGAN