玩转PDF之 ocr3000 重度ocr批量识别爱好者的福音!

PDF批量ocr识别以及图片批量识别工具!

支持多次,多pdf,图片批量ocr,不限量识别!

目标:批量ocr需求的人士。大大提升工作学习效率。

工作和学习过程中,会遇到很多扫描件,无法复制造成学习和生产力效率低下。我们可以通过批量ocr解决这个困扰!转换成可复制的文字,便于整理,修改,笔记。。

需要获得百度的key密钥,即注册一个百度ai账号,(如果有百度网盘账号扫码就行)软件设置中输入ocr普通版的秘钥,就可以用啦!

方法:

如何使用百度智能云OCR获取APIKey和SecretKey_Maple-CSDN博客​blog.csdn.net

如何申请百度文字识别apikey和Secret Key​blog.csdn.net

OCR3000 V1.53下载地址:

1

链接: https://pan.baidu.com/s/1NroV2zx1Gbjol1yEwSD9vw

提取码: ksf4

2

https://wws.lanzoui.com/b0267lwhg
密码:agct

具体功能如下

基础版:

1 扫描pdf转txt 批量ocr,输出txt 准确率98%-100% 看扫描件的质量越高识别率越高。

2 识别后的txt文件排版优化,消除非段落换行,首行缩进。

3 非扫描pdf转txt (ocr方式)

4 pdf输出同时,保存json,方便二次制作。

5 扫描pdf 批量ocr,输出txt和Pdf,并且保留原pdf书签目录 扫描件质量越高识别率越高最高100%

6 输出的pdf完美匹配 ipad 手机 电纸书 任意调整每一行的字数。

7 错误日志记录

8 所有ocr都将另保存为json格式,以后可以任意定制pdf版式 比如字体 字号 行间距 字数

高级版(逐步开放)

1 动态查看任务识别进度

2 图片批量导入 ocr输出txt 和pdf

3 识别双栏排版。

4 识别三多栏排版。

5 识别不规则排版,并重排。

6、智能重排功能。

7、人工智能识别段落,标题,章节标题目录,页码,文档中图片。并重排。

8 任意类型的图片可以ocr

9 人工智能识别后导出word格式

10 根据json元数据创建pdf

11 本地ocr引擎

ocr3000优势:

1、pdf,图片的批量ocr:

批量识别,实现了大批量转换,工作学习效率大大提高。

2、识别率高:

利用百度提供的api接口,实现了98%-100%的识别正确率。

使用方法:

下载后解压缩文件,双击ocr3000.exe运行软件。

点击“设置”,输入百度的两个key文件。 key的获取方法见上文。

拖动需要识别的pdf到上方窗口,点击右侧的pdf---pdf或者pdf--txt按钮。

同理 图片的批量识别方法相同,拖动图片到上方窗口,点击pdf-txt 或者pdf-pdf完成图片的识别(一按钮多用途)

旁边的小黑框可以显示每一步的进度提示。未来版本会直接在主窗口观察进度,去掉假死这种模式。

制作完成后,右侧下方有四个查看按钮,可以打开识别完成的目录。

识别完成的文件分为两个,一个是未进行排版优化的原版txt,一个是优化排版后的txt,方便用户选择使用。

识别前:

识别后的pdf,全转换成文字了,这样可以整本书搜索了! 很方便!:

同时会保存一个原版txt和优化后的txt,可以轻量化阅读,做笔记:

输出的pdf可以设置:

有三种输出可以勾选,我默认给大家做了一个28字每行的格式。

剩下两种按需勾选,可以设置成用户自己喜爱的格式。比如每行21个字。

然后勾选前面的复选框,点确定,重启软件即可生效。

精度设置:

全自动无损提取pdf中的图片

无法无损提取的图片则进行有损导出,设置如下:

设置-导出图片清晰度 默认是4 一般选用1-4 数字越大,ocr之前导出的每张图片越清晰,但导出速度越慢。反之越小,导出的图片越模糊,但速度快。

txt优化排版:同理,拖动待处理txt文件到上方窗口,点右侧“txt优化排版”即可。

可以首行缩进,可以取消段落换行。

优化后的效果如下:

Win10用户注意:

假故障:

程序进行ocr等任务时,cmd界面(小黑框)会卡死,这时候用鼠标点一下小黑框(cmd界面),单机回车,则继续处理。

原因:

由于win10的cmd开启了快速编辑模式,导致鼠标一点黑框就暂停了。

解决方法:

点击cmd黑框右上角-默认值-取消勾选“快速编辑模式” ,重启程序 即可!

下一个版本,会自动处理此问题不需要手动设置!

玩转PDF之 ocr3000 重度ocr批量识别爱好者的福音!相关推荐

  1. [软件工具]OCR批量识别图片提取文字信息提取号码编号单号软件使用教程

    当你有很多图片,但是想提取这些图片里面的手机号或者编号或者快递单号,或者是其他一些信息时候这个工具就很有用了,一般都是通过打开图片一张一张去查看手动输入信息,但是图片很多时候基本就是个体力活,十分不方 ...

  2. 图片PDF转文字需要进行OCR文字识别

    1.天若ocr(最强,都是和adobe pdf 快捷键f4冲突) 2.汉王orc(离线,拖入软件里识别) 3.白描(手机识别汉字强) 4.abbyy finereader(国外老牌,离线外文优秀,手机 ...

  3. qpushbutton里面的文字怎么换行_ipad读PDF必备,OCR局部识别文字并快速提取,免费的buff你要不要?...

    随着苹果硬件和软件的不断开发更新,ipad已经成为不少人的生产力工具之一了.相信很多朋友都免不了拿它来阅读PDF文件,但并不是所有PDF都是可以直接提取其中的文字的,而我们往往又会有这方面的需求.对于 ...

  4. PDF批量识别OCR,Adobe acrobat pro批量识别pdf

    搜索了很久也没有找到批量识别海量pdf文件的方法,结果在adobe的官方找到了"动作" 这个功能. adobe acrobat pro是全世界最好的识别中文的软件,没有之一. 走的 ...

  5. .net core word转pdf_Enolsoft PDF to Word with OCR for Mac(PDF转Word软件)

    Enolsoft PDF to Word with OCR mac版是Macos上一款功能强大的PDF转Word软件,这款软件可以通过ocr技术将pdf文件扫描并转换为word文档,不管你要转换的pd ...

  6. Enolsoft PDF Converter with OCR Mac(PDF格式转换及OCR识别软件)

    Enolsoft PDF Converter with OCR Mac是一款专为Mac用户所设计的PDF格式转换及OCR识别软件,PDF Converter with OCR Mac特别版支持将PDF ...

  7. 如何用OCR文字识别软件将PDF转换成Excel

    最近老板老是让小编处理PDF文件,这OCR识别软件咱也不懂,也不敢问,只能一字一字的码在Excel上,但是这波操作效率不高,还没完成任务,老板又发了一堆PDF文件需要处理,怎么办呢? 跟朋友说了这事后 ...

  8. ABBYY FineReader 15标准版OCR文字识别及PDF编辑软工具

    ABBYY FineReader PDF提供的不仅仅是基本的文档转换.经过28年的上市和1亿次安装,我们不断开发和改进以最新人工智能为核心的OCR技术工具,为您提供前所未有的文档控制水平,这些文档是1 ...

  9. VBA批量OCR识别提取身份证照片信息_白描网页版 - 高效准确且免费的OCR文字识别工具...

    遇到无法复制的文字怎么办?今天推荐一款实用的OCR文字扫描识别利器. 介绍 白描是一款像猫一样灵动的OCR扫描识别神器.具有高准确度的文字识别.表格识别转Excel.批量识别.识别后翻译.文件扫描等功 ...

最新文章

  1. 京东智能情感客服挽救一名学生生命,“可信赖的AI”用温暖前行
  2. 弹指之间 -- Waltz
  3. Win10系列:JavaScript 的 WinJS库
  4. php网页打开输入密码,PHP输入密码查看网页
  5. C++函数声明和定义
  6. Spring Boot 2.x(十五):Dubbo + Zookeeper + Dubbo Admin
  7. java一个界面用另一个界面的值_如何将参数/值从一个弹出窗口传递到Angular2中的另一个弹出窗口...
  8. laravel 获取最后一条sql的小函数
  9. html库存代码,库存汇总.html
  10. c语言经典题(期中/期末复习)(xdoj)
  11. 图像处理笔记2-直方图与直方图均衡化histogram equalization
  12. 技术人的充电时刻,200分钟QA交流,尽在SDCC 2017·深圳站
  13. EXCEL实用技巧-多条件求和、多条件计数、多条件查找
  14. 微信输出日志在电脑桌面
  15. 网易im即时通讯 移动端嵌入web
  16. 使用Ventoy安装Deepin系统出现Error verification failed 0x1A Security violation错误
  17. Leetcode2169. 得到 0 的操作数
  18. Python实现气象天气数据采集与分析【定时邮件发送最新天气提醒+基于时间轴制作Gif天气演变图】
  19. baxter机器人连接
  20. python 组合优化 回撤最小_【揭秘专业投资者的武器】经典组合优化模型 在行业资产配置中的应用示例...

热门文章

  1. android应用接入第三方推送实践
  2. python mysql源码安装_源码包安装(Python mysql redis)
  3. jquery 对象不支持此属性或方法
  4. PDCCH介绍—资源映射(Resource Mapping)
  5. android(二) UI组件
  6. 蜡笔小新的经典恶毒对话
  7. 实验二:漏洞扫描之Nessus
  8. C语言的整型和长整型的字节长
  9. 自制面膜让你轻松美容 - 健康程序员,至尚生活!
  10. 注册表学习,修改注册表达到一定的效果