Tesseract-OCR中文语言包缺失的解决办法
介绍
Tesseract-OCR 5.0的win安装包即使选中中文也会出现无法安装中文的状况,官方文档给出的解释是自己下载语言包即可,但是github下载整个仓库实在是太庞大了,因此这里单独git中文语言包。
后来git Github的时候发现还是很慢,于是转站码云。
如果你懒的操作,我也做好了压缩包,直接拿走不谢
https://download.csdn.net/download/weixin_43031092/12331633
但是有一个问题就是码云上的数据是就的怎么办?
很简单,把下图中的网址换成官方的:
https://github.com/tesseract-ocr/tessdata.git
缺点就是github网速慢!!!
git单文件拉取
我是在tessdata下新建了一个文件夹tmpgitrpo用来拉取文件。按如下代码操作即可拉取四个中文语言包。
Kearney@Kearney MINGW64 /p/Program Files/Tesseract-OCR/tessdata/tmpgitrpo
$ git init
$ git remote add -f origin https://gitee.com/colluslau/tessdata_fast.git
$ git config core.sparsecheckout true
//四个echo用来添加要单独拉取的语言包
$ echo chi_sim.traineddata >> .git/info/sparse-checkout
$ echo chi_sim_vert.traineddata >> .git/info/sparse-checkout
$ echo chi_tra.traineddata >> .git/info/sparse-checkout
$ echo chi_tra_vert.traineddata >> .git/info/sparse-checkout
$ git pull origin master
拉取完四个文件后将四个语言包剪切到tessdata下即可。然后把临时文件夹tmpgitrpo删掉即可
测试
进入:\Program Files\Tesseract-OCR目录按住shift鼠标右键进入powershell
输入如下命令
.\tesseract --list-langs
参考
- https://gitee.com/colluslau/tessdata_fast?_from=gitee_search
- https://www.jianshu.com/p/74a0441ed9b7
- https://github.com/tesseract-ocr/tessdoc/blob/master/Data-Files.md
- https://github.com/UB-Mannheim/tesseract/wiki/Install-additional-language-and-script-models
Tesseract-OCR中文语言包缺失的解决办法相关推荐
- Ubuntu中文语言包下载失败解决方法
Ubuntu的默认软件下载源是美国 更改软件下载源 在菜单主界面中找到如下图标并打开 按照下方图片进行配置,点击Download from:下拉菜单,选择Other(其他站点) 找到China在Chi ...
- Ubuntu中安装中文语言包
由于在之前用docker搭建zabbix时,修改语言时无法选择中文,可能时系统中缺少中文语言包,所以安装中文语言包,完美解决,以下是解决方案. 1.安装中文语言包 apt install langua ...
- ubuntu16.04在英文状态下安装中文语言包的过程(法一:图形界面的方式) 以及 安装中文语言包后无法选择汉语问题的解决
ubuntu16.04在英文状态下安装中文语言包的过程(法一:图形界面的方式) 以及 安装中文语言包后无法选择汉语问题的解决 参考文章: (1)ubuntu16.04在英文状态下安装中文语言包的过程( ...
- win10html中文乱码,Win10预览版10125中文语言包安装及乱码解决方法
昨天,Win10预览版10125的英文ISO系统镜像以及Win10 build 10125的中文语言包已经泄露到网络上了,很多朋友迫不及待尝试安装了这个版本,有些朋友反馈即使安装了中文语言包,有些软件 ...
- 关于Win10英文版安装中文语言包后,新用户登录还是英文界面的问题的解决方法
当我们在Win10的英文版系统安装了中文语言包,并设置了中文显示语言,如果切换新用户登录,会发现新用户还是英文的界面.这是因为有一项选项还没有设置. 解决方法:
- update过程中遇到kb2829760补丁无法更新而导致vs安装失败的解决方法: 1、安装KB2829760; 2、安装KB2829760中文语言包; 3、安装VS2013 with upda
update过程中遇到kb2829760补丁无法更新而导致vs安装失败的解决方法: 1.安装KB2829760: 2.安装KB2829760中文语言包: 3.安装VS2013 with update. ...
- Joomla 2.5 中文语言包安装模板报错
Joomla 2.5后台安装中文语言包后,想安装新模板,后台报错:Joomla 2.5 中文语言包安装模板报错:Notice: iconv() [function.iconv]: Detected a ...
- windows7安装中文语言包及文乱码问题解决方法
[http://youzitool.com 新博客,欢迎访问] windows7安装中文语言包及文乱码问题解决方法 安装中文语言包 1.最近安装了windows7英文版,如果要使用中文语言,可通过&q ...
- centos英文版下如何安装中文语言包
centos安装过程中,安装语言包时选择了english,在安装完毕后浏览中文网页或查看中文文档时总是宣誓乱码,因此需要安装中文语言包,如果不能从安装盘进行安装,可以通过yum进行安装,安装办法为: ...
最新文章
- pytorch自动微分,反向传播(一)
- [原创].使用Nios II 9.1中的Flash Programmer无法固化程序到EPCS上
- 使用 Proto 构建了一个简单但功能强大的 lambda 库的测试程序
- JavaScript中this指向
- 深度学习资源一网打尽!论文、数据集、框架、课程、图书等应有尽有
- “无继承”情况下的对象构造
- python热力图美化_python如何画热力图?
- SQL server 列值转列行
- 测试有道:微软测试技术心得 1
- poj 1789 Truck History prim最小生成树 基础!!!!
- window远程桌面连接实现连接他人电脑=》mstsc
- javascript XMLHttpRequest实现下载文件
- 如何用html和css制作网页,html和css如何实现制作一个网页
- 手工创建Oracle11g完整版(超详细)
- 华为HCIP认证用处大吗?
- 全球及中国呼叫中心服务行业运营模式及发展战略分析报告2022-2028年
- 52ypay comsubmit php,Hack易支付平台 - 一站式免签约支付方案-Hack易支付
- 机器学习应用实例|如何识别标题党?
- 注册企业邮箱,怎么给国外的人发邮件?
- 变革:区块链上的政府和企业应用
热门文章
- web服务器、应用服务器、web应用框架
- 解决微信公众号OAuth出现40029(invalid code,不合法的oauth_code)的错误
- svr代码matlab,matlab解决svr代码.docx
- Cops and Robbers(最大流 最小割)
- 如何一个月学会3dsmax游戏建模
- 计算机二级index函数怎么用,Excel函数-match、index(上)-计算机二级Office
- SylixOS异常调试的手段
- BIOS 与 UEFI引导流程
- mysql存储过程游标嵌套_MYSQL存储过程中使用游标嵌套的实例
- R语言 rmd生成 点击好看的html output 设置