1、PDF工具 -- PDF24

需要找一个将扫描型的PDF转换成可搜索可复制的PDF文件的工具,搜到的大部分工具我都试用了,要么转换出来样式不行,要么收费。然后找到了一个下图所示的PDF24 的工具,PDF24提供很多精心裁剪的针对特定问题的工具。所有的PDF工具 - 100%免费 - PDF24 Tools

其中的PDF 文本识别工具可将扫描型的PDF转换成可搜索可复制的PDF文件。PDF24提供在线和离线两种方式。

使用PDF 文本识别工具 ,在线转换文件 通过OCR识别文本 - 简便,在线,免费 - PDF24 Tools

下载离线版本的PDF24 Creator PDF24 Creator - 下载 - 100%免费 - PDF24 Tools

网页版的可以正常使用,推荐使用网页版的。

2、PDF24 OCR程序报错

使用离线版本的PDF24 OCR时出现问题,本文主要记录如何解决下图的问题。

本文使用的是11.4.0的私人版本

在手册中找到关于pdf24-Ocr.exe下的所有语言文件的本地安装方法

解决步骤

所需文件下载地址 :https://download.csdn.net/download/ZMJ_QQ/87361516

1、将trainDataList.txt放入PDF24安装目录的tesseract文件夹。(官网下载地址https://creator.pdf24.org/tesseract/4.0/traindata/local-list.txt

2、将tessdata-master文件夹下的所有文件复制到 tessdata 文件夹下。

另外手册中说的 osd.traineddata文件就在解压的语言包中,不需要找

请确保您使用与 Tesseract 4.0 兼容的语言文件。语言文件可以从 GitHub 上的 tesseract 项目下载。

贴一个github上的项目地址(方法测过了,文件下载失败。如果后期还是无法下载可以使用上文给出的文件)GitHub - tesseract-ocr/tessdata: Trained models with support for legacy and LSTM OCR engine

3、完成上面两步后再重新打开PDF24 OCR,添加文件后点击开始后即可正常使用,如下图所示

文章可能写的啰嗦,如果后期我的语言文件不生效,可以到官方手册中查找语言文件下载的方法。

扫描型PDF转成可搜索可复制的文字型PDF,使用PDF24 OCR 程序报“下载需要的文件时出现一个错误”相关推荐

  1. 【ABBYY FineReader】如何利用世界著名PDF工具ABBYY FineReader给扫描版PDF转换成可搜索的PDF?知识管理的最佳设置建议、不会降低最后显示的质量

    一.OCR编辑器的进入 如果你安装后在桌面上没看到,可以去安装目录查找,名称为[FineReaderOCR.exe]. 二.进入后首先两个设置 1.设置OCR识别语言 先把OCR识别语言设为简体中文和 ...

  2. Win10任务栏搜索框无法输入文字怎么回事?

    Win10任务栏搜索框无法输入文字怎么回事?我们平时需要查找电脑里面的文件时,可以通过任务栏里面的搜索栏来进行快速的查找访问.有用户在搜索栏里面输入文字的时候,却发现无法进行文字输入了,那么这个情况是 ...

  3. 如何把扫描pdf转换成txt

    如何把扫描pdf转换成txt 什么是PDF文件格式,选择哪一款PDF转换成TXT转换器能够提高工作效率?PDF怎么转换为TXT?今天菜鸟这堂课就来为大家详细讲解. 一.什么是PDF文件格式? 首先我们 ...

  4. blob js 下载word乱码_这几个相见恨晚的PDF转换成Word技巧,请收好

    生活学习中,免不了上网查找一些专业资料或者学术论文等,下载下来发现几乎都是PDF格式,若想对PDF文档进行编辑,实属不易,如何有效地对PDF文档进行图片,文字等复制,粘帖使用呢? 答案很简单,直接将P ...

  5. 这几个相见恨晚的PDF转换成Word技巧,请收好

    生活学习中,免不了上网查找一些专业资料或者学术论文等,下载下来发现几乎都是PDF格式,若想对PDF文档进行编辑,实属不易,如何有效地对PDF文档进行图片,文字等复制,粘帖使用呢? 答案很简单,直接将P ...

  6. pdf转换成html python,在Python中将pdf转换为html

    Python 2.6 我试图解析我的pdf文件,其中一种方法是将其转换为html并提取标题和段落. 所以,我尝试了pdf2htmlEX,它将我的pdf转换成html格式,而不干扰我的pdf格式...到 ...

  7. 万能的pdf转换成jpg转换器软件

    万能的pdf转换成jpg转换器软件 我们在工作中如果有一个万能的编辑软件常常起着重要的作用,可以直接提高我们的工作效率.一个实用的的文件识别.编辑和转换软件,是很多个人和企业优先选用的工具.全面的文件 ...

  8. 如何免费将PDF转成JPG?

    PDF格式文件因为其自身强大的安全功能逐渐受到各大公司的青睐.可是在部分特殊情况下,需要图片格式的文档,那么怎样才能将PDF转换成JPG图片呢? 市面上对于PDF转换JPG的方式多种多样,但是要做到高 ...

  9. 如何将pdf转换成jpg图片的格式

    PDF文件是以PostScript语言图象模型为基础,因pdf包含的格式比较多,很多时候需要把PDF转换为JPG来适应各种不同的场合,但是如何将pdf转换成jpg成了让大家头疼的问题.下面小编就将pd ...

最新文章

  1. syntax error near unexpected token
  2. mysql数据库中的十进位是什么意思?
  3. 从实体类get方法拿不到值,可能是字段带_的原因
  4. C++什么是内存泄漏
  5. qq2440 cs8900移植
  6. jqGrid,REST,AJAX和Spring MVC集成
  7. java http响应头,java – HTTP响应标头内容处理附件
  8. 安全开发Java:日志注入,并没那么简单
  9. python做一个小游戏_利用python做个小游戏
  10. Oracle 数字与空值的排序问题
  11. 教你如何用双SATA硬盘组建RAID系统
  12. 2×125MW发电厂升压站电气部分设计
  13. autojs 复制到粘贴板_JS复制到剪贴板示例代码
  14. 机器学习的应用–大数据
  15. X在苍茫大地 闻一达(闻大嘴) 闻明远
  16. JS(fullpage)的使用
  17. app installation failed 的问题的解决过程
  18. 关于gcc -m32 -o 编译错误: /usr/bin/ld: cannot find -lgcc
  19. 蓝桥杯2016初赛python题解
  20. 个人家用nas_个人与家庭NAS怎么样,您知道吗?

热门文章

  1. 【五一创作】五一旅游最佳去处淄博
  2. OSChina 周四乱弹 ——盘点安全圈都有哪些又酷又萌的妹子
  3. android切换账号登录界面,华为游戏切换安卓账号登陆界面
  4. 软件体系结构之14面试题
  5. 使用策略模式设计一个动作冒险类游戏
  6. crontab php 定时任务
  7. Spring IOC:bean的生命周期与@Autowire(1)
  8. 为数不多的人知道的AndroidStudio快捷键(二)
  9. java读取web工程目录之外的图片并显示
  10. 面试着装需要注意的点有哪些