玩转PDF之 ocr3000 重度ocr批量识别爱好者的福音！

PDF批量ocr识别以及图片批量识别工具！

支持多次，多pdf，图片批量ocr,不限量识别！

目标:批量ocr需求的人士。大大提升工作学习效率。

工作和学习过程中，会遇到很多扫描件，无法复制造成学习和生产力效率低下。我们可以通过批量ocr解决这个困扰！转换成可复制的文字，便于整理，修改，笔记。。

需要获得百度的key密钥，即注册一个百度ai账号，（如果有百度网盘账号扫码就行）软件设置中输入ocr普通版的秘钥，就可以用啦！

方法:

如何使用百度智能云OCR获取APIKey和SecretKey_Maple-CSDN博客blog.csdn.net

如何申请百度文字识别apikey和Secret Keyblog.csdn.net

OCR3000 V1.53下载地址：

链接: https://pan.baidu.com/s/1NroV2zx1Gbjol1yEwSD9vw

提取码: ksf4

https://wws.lanzoui.com/b0267lwhg
密码:agct

具体功能如下

基础版：

1 扫描pdf转txt 批量ocr，输出txt 准确率98%-100% 看扫描件的质量越高识别率越高。

2 识别后的txt文件排版优化，消除非段落换行，首行缩进。

3 非扫描pdf转txt (ocr方式）

4 pdf输出同时，保存json，方便二次制作。

5 扫描pdf 批量ocr，输出txt和Pdf，并且保留原pdf书签目录扫描件质量越高识别率越高最高100%

6 输出的pdf完美匹配 ipad 手机电纸书任意调整每一行的字数。

7 错误日志记录

8 所有ocr都将另保存为json格式，以后可以任意定制pdf版式比如字体字号行间距字数

高级版（逐步开放）

1 动态查看任务识别进度

2 图片批量导入 ocr输出txt 和pdf

3 识别双栏排版。

4 识别三多栏排版。

5 识别不规则排版，并重排。

6、智能重排功能。

7、人工智能识别段落，标题，章节标题目录，页码，文档中图片。并重排。

8 任意类型的图片可以ocr

9 人工智能识别后导出word格式

10 根据json元数据创建pdf

11 本地ocr引擎

ocr3000优势：

1、pdf，图片的批量ocr：

批量识别，实现了大批量转换，工作学习效率大大提高。

2、识别率高：

利用百度提供的api接口，实现了98%-100%的识别正确率。

使用方法：

下载后解压缩文件，双击ocr3000.exe运行软件。

点击“设置”，输入百度的两个key文件。 key的获取方法见上文。

拖动需要识别的pdf到上方窗口，点击右侧的pdf---pdf或者pdf--txt按钮。

同理图片的批量识别方法相同，拖动图片到上方窗口，点击pdf-txt 或者pdf-pdf完成图片的识别（一按钮多用途）

旁边的小黑框可以显示每一步的进度提示。未来版本会直接在主窗口观察进度，去掉假死这种模式。

制作完成后，右侧下方有四个查看按钮，可以打开识别完成的目录。

识别完成的文件分为两个，一个是未进行排版优化的原版txt，一个是优化排版后的txt，方便用户选择使用。

识别前：

识别后的pdf，全转换成文字了，这样可以整本书搜索了！很方便！：

同时会保存一个原版txt和优化后的txt，可以轻量化阅读，做笔记：

输出的pdf可以设置：

有三种输出可以勾选，我默认给大家做了一个28字每行的格式。

剩下两种按需勾选，可以设置成用户自己喜爱的格式。比如每行21个字。

然后勾选前面的复选框，点确定，重启软件即可生效。

精度设置:

全自动无损提取pdf中的图片

无法无损提取的图片则进行有损导出，设置如下：

设置-导出图片清晰度默认是4 一般选用1-4 数字越大，ocr之前导出的每张图片越清晰，但导出速度越慢。反之越小，导出的图片越模糊，但速度快。

txt优化排版：同理，拖动待处理txt文件到上方窗口，点右侧“txt优化排版”即可。

可以首行缩进，可以取消段落换行。

优化后的效果如下：

Win10用户注意:

假故障:

程序进行ocr等任务时，cmd界面（小黑框）会卡死，这时候用鼠标点一下小黑框（cmd界面），单机回车，则继续处理。

原因:

由于win10的cmd开启了快速编辑模式，导致鼠标一点黑框就暂停了。

解决方法:

点击cmd黑框右上角-默认值-取消勾选“快速编辑模式” ，重启程序即可！

下一个版本，会自动处理此问题不需要手动设置！

玩转PDF之 ocr3000 重度ocr批量识别爱好者的福音！相关推荐

[软件工具]OCR批量识别图片提取文字信息提取号码编号单号软件使用教程
当你有很多图片,但是想提取这些图片里面的手机号或者编号或者快递单号,或者是其他一些信息时候这个工具就很有用了,一般都是通过打开图片一张一张去查看手动输入信息,但是图片很多时候基本就是个体力活,十分不方 ...
图片PDF转文字需要进行OCR文字识别
1.天若ocr(最强,都是和adobe pdf 快捷键f4冲突) 2.汉王orc(离线,拖入软件里识别) 3.白描(手机识别汉字强) 4.abbyy finereader(国外老牌,离线外文优秀,手机 ...
qpushbutton里面的文字怎么换行_ipad读PDF必备，OCR局部识别文字并快速提取，免费的buff你要不要？...
随着苹果硬件和软件的不断开发更新,ipad已经成为不少人的生产力工具之一了.相信很多朋友都免不了拿它来阅读PDF文件,但并不是所有PDF都是可以直接提取其中的文字的,而我们往往又会有这方面的需求.对于 ...
PDF批量识别OCR，Adobe acrobat pro批量识别pdf
搜索了很久也没有找到批量识别海量pdf文件的方法,结果在adobe的官方找到了"动作" 这个功能. adobe acrobat pro是全世界最好的识别中文的软件,没有之一. 走的 ...
.net core word转pdf_Enolsoft PDF to Word with OCR for Mac(PDF转Word软件)
Enolsoft PDF to Word with OCR mac版是Macos上一款功能强大的PDF转Word软件,这款软件可以通过ocr技术将pdf文件扫描并转换为word文档,不管你要转换的pd ...
Enolsoft PDF Converter with OCR Mac(PDF格式转换及OCR识别软件)
Enolsoft PDF Converter with OCR Mac是一款专为Mac用户所设计的PDF格式转换及OCR识别软件,PDF Converter with OCR Mac特别版支持将PDF ...
如何用OCR文字识别软件将PDF转换成Excel
最近老板老是让小编处理PDF文件,这OCR识别软件咱也不懂,也不敢问,只能一字一字的码在Excel上,但是这波操作效率不高,还没完成任务,老板又发了一堆PDF文件需要处理,怎么办呢? 跟朋友说了这事后 ...
ABBYY FineReader 15标准版OCR文字识别及PDF编辑软工具
ABBYY FineReader PDF提供的不仅仅是基本的文档转换.经过28年的上市和1亿次安装,我们不断开发和改进以最新人工智能为核心的OCR技术工具,为您提供前所未有的文档控制水平,这些文档是1 ...
VBA批量OCR识别提取身份证照片信息_白描网页版 - 高效准确且免费的OCR文字识别工具...
遇到无法复制的文字怎么办?今天推荐一款实用的OCR文字扫描识别利器. 介绍白描是一款像猫一样灵动的OCR扫描识别神器.具有高准确度的文字识别.表格识别转Excel.批量识别.识别后翻译.文件扫描等功 ...

玩转PDF之 ocr3000 重度ocr批量识别爱好者的福音！

玩转PDF之 ocr3000 重度ocr批量识别爱好者的福音！

玩转PDF之 ocr3000 重度ocr批量识别爱好者的福音！相关推荐

最新文章

热门文章