介绍

Tesseract-OCR 5.0的win安装包即使选中中文也会出现无法安装中文的状况,官方文档给出的解释是自己下载语言包即可,但是github下载整个仓库实在是太庞大了,因此这里单独git中文语言包。
后来git Github的时候发现还是很慢,于是转站码云。

如果你懒的操作,我也做好了压缩包,直接拿走不谢
https://download.csdn.net/download/weixin_43031092/12331633

但是有一个问题就是码云上的数据是就的怎么办?
很简单,把下图中的网址换成官方的:
https://github.com/tesseract-ocr/tessdata.git
缺点就是github网速慢!!!

git单文件拉取

我是在tessdata下新建了一个文件夹tmpgitrpo用来拉取文件。按如下代码操作即可拉取四个中文语言包。

Kearney@Kearney MINGW64 /p/Program Files/Tesseract-OCR/tessdata/tmpgitrpo
$ git init
$ git remote add -f origin https://gitee.com/colluslau/tessdata_fast.git
$ git config core.sparsecheckout true
//四个echo用来添加要单独拉取的语言包
$ echo chi_sim.traineddata >> .git/info/sparse-checkout
$ echo chi_sim_vert.traineddata >> .git/info/sparse-checkout
$ echo chi_tra.traineddata >> .git/info/sparse-checkout
$ echo chi_tra_vert.traineddata >> .git/info/sparse-checkout
$ git pull origin master


拉取完四个文件后将四个语言包剪切到tessdata下即可。然后把临时文件夹tmpgitrpo删掉即可

测试

进入:\Program Files\Tesseract-OCR目录按住shift鼠标右键进入powershell
输入如下命令

 .\tesseract --list-langs

参考

  • https://gitee.com/colluslau/tessdata_fast?_from=gitee_search
  • https://www.jianshu.com/p/74a0441ed9b7
  • https://github.com/tesseract-ocr/tessdoc/blob/master/Data-Files.md
  • https://github.com/UB-Mannheim/tesseract/wiki/Install-additional-language-and-script-models

Tesseract-OCR中文语言包缺失的解决办法相关推荐

  1. Ubuntu中文语言包下载失败解决方法

    Ubuntu的默认软件下载源是美国 更改软件下载源 在菜单主界面中找到如下图标并打开 按照下方图片进行配置,点击Download from:下拉菜单,选择Other(其他站点) 找到China在Chi ...

  2. Ubuntu中安装中文语言包

    由于在之前用docker搭建zabbix时,修改语言时无法选择中文,可能时系统中缺少中文语言包,所以安装中文语言包,完美解决,以下是解决方案. 1.安装中文语言包 apt install langua ...

  3. ubuntu16.04在英文状态下安装中文语言包的过程(法一:图形界面的方式) 以及 安装中文语言包后无法选择汉语问题的解决

    ubuntu16.04在英文状态下安装中文语言包的过程(法一:图形界面的方式) 以及 安装中文语言包后无法选择汉语问题的解决 参考文章: (1)ubuntu16.04在英文状态下安装中文语言包的过程( ...

  4. win10html中文乱码,Win10预览版10125中文语言包安装及乱码解决方法

    昨天,Win10预览版10125的英文ISO系统镜像以及Win10 build 10125的中文语言包已经泄露到网络上了,很多朋友迫不及待尝试安装了这个版本,有些朋友反馈即使安装了中文语言包,有些软件 ...

  5. 关于Win10英文版安装中文语言包后,新用户登录还是英文界面的问题的解决方法

    当我们在Win10的英文版系统安装了中文语言包,并设置了中文显示语言,如果切换新用户登录,会发现新用户还是英文的界面.这是因为有一项选项还没有设置. 解决方法:

  6. update过程中遇到kb2829760补丁无法更新而导致vs安装失败的解决方法: 1、安装KB2829760; 2、安装KB2829760中文语言包; 3、安装VS2013 with upda

    update过程中遇到kb2829760补丁无法更新而导致vs安装失败的解决方法: 1.安装KB2829760: 2.安装KB2829760中文语言包: 3.安装VS2013 with update. ...

  7. Joomla 2.5 中文语言包安装模板报错

    Joomla 2.5后台安装中文语言包后,想安装新模板,后台报错:Joomla 2.5 中文语言包安装模板报错:Notice: iconv() [function.iconv]: Detected a ...

  8. windows7安装中文语言包及文乱码问题解决方法

    [http://youzitool.com 新博客,欢迎访问] windows7安装中文语言包及文乱码问题解决方法 安装中文语言包 1.最近安装了windows7英文版,如果要使用中文语言,可通过&q ...

  9. centos英文版下如何安装中文语言包

    centos安装过程中,安装语言包时选择了english,在安装完毕后浏览中文网页或查看中文文档时总是宣誓乱码,因此需要安装中文语言包,如果不能从安装盘进行安装,可以通过yum进行安装,安装办法为: ...

最新文章

  1. pytorch自动微分,反向传播(一)
  2. [原创].使用Nios II 9.1中的Flash Programmer无法固化程序到EPCS上
  3. 使用 Proto 构建了一个简单但功能强大的 lambda 库的测试程序
  4. JavaScript中this指向
  5. 深度学习资源一网打尽!论文、数据集、框架、课程、图书等应有尽有
  6. “无继承”情况下的对象构造
  7. python热力图美化_python如何画热力图?
  8. SQL server 列值转列行
  9. 测试有道:微软测试技术心得 1
  10. poj 1789 Truck History prim最小生成树 基础!!!!
  11. window远程桌面连接实现连接他人电脑=》mstsc
  12. javascript XMLHttpRequest实现下载文件
  13. 如何用html和css制作网页,html和css如何实现制作一个网页
  14. 手工创建Oracle11g完整版(超详细)
  15. 华为HCIP认证用处大吗?
  16. 全球及中国呼叫中心服务行业运营模式及发展战略分析报告2022-2028年
  17. 52ypay comsubmit php,Hack易支付平台 - 一站式免签约支付方案-Hack易支付
  18. 机器学习应用实例|如何识别标题党?
  19. 注册企业邮箱,怎么给国外的人发邮件?
  20. 变革:区块链上的政府和企业应用

热门文章

  1. web服务器、应用服务器、web应用框架
  2. 解决微信公众号OAuth出现40029(invalid code,不合法的oauth_code)的错误
  3. svr代码matlab,matlab解决svr代码.docx
  4. Cops and Robbers(最大流 最小割)
  5. 如何一个月学会3dsmax游戏建模
  6. 计算机二级index函数怎么用,Excel函数-match、index(上)-计算机二级Office
  7. SylixOS异常调试的手段
  8. BIOS 与 UEFI引导流程
  9. mysql存储过程游标嵌套_MYSQL存储过程中使用游标嵌套的实例
  10. R语言 rmd生成 点击好看的html output 设置