根据图片自动识别其中的内容

话不多说先上依赖
引入 Tess4J

     <dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>3.2.1</version></dependency>

需要安装tesseractt 并且配置环境

第一步:下载安装包

根据https://github.com/tesseract-ocr/tesseract/wiki,我找到非官方的安装包,好像我只看到64位的安装包http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe,下载后直接安装即可,但是要记得你的安装目录,我们等会配置环境变量要用。

第二步:安装

直接执行下载好的tesseract-ocr-setup-4.00.00dev.exe,下一步、下一步安装。

第三步:配置环境变量

注意:我的系统是win7,其他系统应该差不多,跟配置java变量一样

复制你的安装地址,我的是安装在C:\Program Files (x86)\Tesseract-OCR,界面如下:

复制安装路径“C:\Program Files (x86)\Tesseract-OCR”,进入“控制面板\系统和安全\系统”,点击

“系统保护”

进入到以下界面:

点击环境变量,进入配置以下界面:

把刚才的安装路径“C:\Program Files (x86)\Tesseract-OCR”添加到红线划的PATH和Path,注意,添加时候开头用“;”跟之前的变量隔开,结尾以“;”结尾。下面是我的配置信息样本:

C:\Users\Administrator\AppData\Roaming\Composer\vendor\bin;C:\Users\Administrator\AppData\Roaming\npm;C:\Program Files (x86)\Tesseract-OCR;

配置好了点击保存。

打开命令终端,输入:tesseract -v,可以看到版本信息

如果出现报错,估计是环境变量没配置好。

到这里,我们就算安装完成了,但是,我们的系统还是无法识别中文的,我们要去下载简体汉字、繁体汉字语言包(上文给了地址了),下载好之后放到安装目录的tessconfigs目录下即可。

补充:因为没有配置全局变量,无法跨盘执行数据转换,这里我们在环境变量那增加一个配置信息

系统变量—->新建:

增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径C:\Program Files (x86)\Tesseract-OCR;

配置完成后下载对应的中文包
https://github.com/tesseract-ocr/tessdata
找到chi_sim.traineddata 这个文件下载后复制到
C:\Program Files (x86)\Tesseract-OCR\tessdata 

这些都搞定后.进入idea编写代码

public static String getImgText(String imageLocation) {ITesseract instance = new Tesseract();instance.setDatapath("所存放的语言包的路径");try{String imgText = instance.doOCR(new File(imageLocation));return imgText;}catch (TesseractException e){e.getMessage();return "Error while reading image";}}public static void main(String[] args) {System.out.println(getImgText("想要识别的图片地址"));}

接下来我们就能使用 Java 进行图片识别了。例如下面一张图片

控制台信息如下

根据图片自动识别其中的内容相关推荐

  1. 这三款图片自动识别软件值得推荐

    随着数字化时代的到来,图片在人类日常生活.工作和学习中扮演着越来越重要的角色.如何有效地处理和管理这些海量图片数据,成为了当前亟待解决的问题之一.为了解决这个问题,开始有了图片自动识别技术.利用计算机 ...

  2. python识别图片指定位置文字_python批量识别图片指定区域文字内容

    Python批量识别图片指定区域文字内容,供大家参考,具体内容如下 简介 对于一张图片,需求识别指定区域的内容 1.截取原始图上的指定图片当做模板 2.根据模板相似度去再原始图片上识别准确坐标 3.根 ...

  3. [css] 如何设置背景图片不随着文本内容的滚动而滚动?

    [css] 如何设置背景图片不随着文本内容的滚动而滚动? 直接对div设置background:url不就好了嘛?上代码.<!DOCTYPE html> <html lang=&qu ...

  4. python 制定识别图片的某些区域_python批量识别图片指定区域文字内容

    Python批量识别图片指定区域文字内容,供大家参考,具体内容如下 简介 对于一张图片,需求识别指定区域的内容 1.截取原始图上的指定图片当做模板 2.根据模板相似度去再原始图片上识别准确坐标 3.根 ...

  5. 微信小程序 图片上传与内容安全审核

    文章目录 原由 内容审核种类 小程序云开发 图片检测 创建云函数 编写图片检测代码 小程序图片处理 图片上传 图片压缩 云函数安全检测接入 文本检测 最后的坑 原由 之前有开发一个微信小程序,拥有图片 ...

  6. html图片隐藏文字,怎样用CSS隐藏图片背景的文字内容

    这次的案列是怎样用CSS隐藏图片背景的文字内容,我们先使用使用background背景是将图片设为背景显示:然后使用text-indent缩进是隐藏a链接内容和链接标签是对文字设置锚文本链接.下面就是 ...

  7. 如何自动识别视频语音内容并生成字幕

    概览 本文将介绍如何使用腾讯云COS SDK调用数据万象的语音识别 能力生成视频字幕文件,并使用腾讯云点播超级播放器(TCPlayer) 播放挂载了字幕的视频. 业务场景 适用于短视频制作时,原始视频 ...

  8. 头条是一款遵循材料设计(Material Design)的第三方今日头条客户端, 聚合了新闻/段子/图片/视频/头条号内容, 没有广告, 仅仅只有存粹的阅读, 不断完善中, 采用 MVP + RxJa

    Toutiao 项目地址:iMeiji/Toutiao  简介:头条是一款遵循材料设计(Material Design)的第三方今日头条客户端, 聚合了新闻/段子/图片/视频/头条号内容, 没有广告, ...

  9. 在ubuntu20.10系统下实现一键OCR识别图片截图中的内容使之转换为文本可以复制粘贴

    目的:因为最近主要使用ubuntu系统,想要将视频中的文字提取出来,实现一键OCR识别图片截图中的内容使之转换为文本可以复制粘贴. 主要思路 利用截图软件gnome-screenshot 进行截取需要 ...

最新文章

  1. java集合框架容器 java框架层级 继承图结构 集合框架的抽象类 集合框架主要实现类...
  2. Exchange Server2013 系列九:常规配置
  3. Linux 常用命令全称,看看你 get 到了哪些?
  4. Swift之深入解析如何实现Promise
  5. VS Code运行Python程序
  6. 数组索引必须为正整数或逻辑值_Office 365函数新世界——动态数组
  7. CSS中class优先级问题
  8. 挺过最艰难的2018,我终将长大
  9. java扶贫,基于jsp的扶贫网站-JavaEE实现扶贫网站 - java项目源码
  10. MySQL 复制:最简单也最容易配置出错
  11. 大数据发展现状和趋势
  12. php程序员未来前景,PHP程序员有前景吗?3个角度为你详解!
  13. 【对话系统】Knowledge-Grounded Dialogue Generation with a Unified Knowledge Representation
  14. RuntimeError: einsum(): operands do not broadcast with remapped shapes [original->remapped]
  15. maya建模模型变黑问题解决
  16. 怎么更改苹果账户名称_苹果新品快来了,你真的学会如何找回你的Apple ID的密码了吗?...
  17. MATLAB 2018b 安装教程(图解)Mac Win Linux下均可安装
  18. 【图像去噪】基于非局部均值(NLM)滤波图像去噪含Matlab源码
  19. 山东大学移动信息门户03
  20. 计算机考验数学 英语分数要求,2020考研数学一110分,能过985大学复试线?通过这3所大学来预测...

热门文章

  1. 微信红包问题matlab,微信红包先抢后抢差距居然这么大?有人做了个实验
  2. Android studio 手写输入字体,自动识别
  3. 图形学笔记(八)画一个可以由鼠标和键盘控制的立方体
  4. 钻石卡兑换儿童机票体验
  5. MySQL数据迁移报错1067 - Invalid default value for ‘xxx‘
  6. 项目搭建--从基础搭建开始
  7. JVM之类加载阶段详解
  8. 目标检测——SPPNet【含全网最全翻译】
  9. 快速分析出圆通单号物流中含退的归类为退回件
  10. 论文解读《ISGm1A:整合序列特征和基因组特征,提高对人类m1ARNA甲基化位点的预测》