玩转PDF之 ocr3000 重度ocr批量识别爱好者的福音!
玩转PDF之 ocr3000 重度ocr批量识别爱好者的福音!
PDF批量ocr识别以及图片批量识别工具!
支持多次,多pdf,图片批量ocr,不限量识别!
目标:批量ocr需求的人士。大大提升工作学习效率。
工作和学习过程中,会遇到很多扫描件,无法复制造成学习和生产力效率低下。我们可以通过批量ocr解决这个困扰!转换成可复制的文字,便于整理,修改,笔记。。
需要获得百度的key密钥,即注册一个百度ai账号,(如果有百度网盘账号扫码就行)软件设置中输入ocr普通版的秘钥,就可以用啦!
方法:
如何使用百度智能云OCR获取APIKey和SecretKey_Maple-CSDN博客blog.csdn.net
如何申请百度文字识别apikey和Secret Keyblog.csdn.net
OCR3000 V1.53下载地址:
1
链接: https://pan.baidu.com/s/1NroV2zx1Gbjol1yEwSD9vw
提取码: ksf4
2
https://wws.lanzoui.com/b0267lwhg
密码:agct
具体功能如下
基础版:
1 扫描pdf转txt 批量ocr,输出txt 准确率98%-100% 看扫描件的质量越高识别率越高。
2 识别后的txt文件排版优化,消除非段落换行,首行缩进。
3 非扫描pdf转txt (ocr方式)
4 pdf输出同时,保存json,方便二次制作。
5 扫描pdf 批量ocr,输出txt和Pdf,并且保留原pdf书签目录 扫描件质量越高识别率越高最高100%
6 输出的pdf完美匹配 ipad 手机 电纸书 任意调整每一行的字数。
7 错误日志记录
8 所有ocr都将另保存为json格式,以后可以任意定制pdf版式 比如字体 字号 行间距 字数
高级版(逐步开放)
1 动态查看任务识别进度
2 图片批量导入 ocr输出txt 和pdf
3 识别双栏排版。
4 识别三多栏排版。
5 识别不规则排版,并重排。
6、智能重排功能。
7、人工智能识别段落,标题,章节标题目录,页码,文档中图片。并重排。
8 任意类型的图片可以ocr
9 人工智能识别后导出word格式
10 根据json元数据创建pdf
11 本地ocr引擎
ocr3000优势:
1、pdf,图片的批量ocr:
批量识别,实现了大批量转换,工作学习效率大大提高。
2、识别率高:
利用百度提供的api接口,实现了98%-100%的识别正确率。
使用方法:
下载后解压缩文件,双击ocr3000.exe运行软件。
点击“设置”,输入百度的两个key文件。 key的获取方法见上文。
拖动需要识别的pdf到上方窗口,点击右侧的pdf---pdf或者pdf--txt按钮。
同理 图片的批量识别方法相同,拖动图片到上方窗口,点击pdf-txt 或者pdf-pdf完成图片的识别(一按钮多用途)
旁边的小黑框可以显示每一步的进度提示。未来版本会直接在主窗口观察进度,去掉假死这种模式。
制作完成后,右侧下方有四个查看按钮,可以打开识别完成的目录。
识别完成的文件分为两个,一个是未进行排版优化的原版txt,一个是优化排版后的txt,方便用户选择使用。
识别前:
识别后的pdf,全转换成文字了,这样可以整本书搜索了! 很方便!:
同时会保存一个原版txt和优化后的txt,可以轻量化阅读,做笔记:
输出的pdf可以设置:
有三种输出可以勾选,我默认给大家做了一个28字每行的格式。
剩下两种按需勾选,可以设置成用户自己喜爱的格式。比如每行21个字。
然后勾选前面的复选框,点确定,重启软件即可生效。
精度设置:
全自动无损提取pdf中的图片
无法无损提取的图片则进行有损导出,设置如下:
设置-导出图片清晰度 默认是4 一般选用1-4 数字越大,ocr之前导出的每张图片越清晰,但导出速度越慢。反之越小,导出的图片越模糊,但速度快。
txt优化排版:同理,拖动待处理txt文件到上方窗口,点右侧“txt优化排版”即可。
可以首行缩进,可以取消段落换行。
优化后的效果如下:
Win10用户注意:
假故障:
程序进行ocr等任务时,cmd界面(小黑框)会卡死,这时候用鼠标点一下小黑框(cmd界面),单机回车,则继续处理。
原因:
由于win10的cmd开启了快速编辑模式,导致鼠标一点黑框就暂停了。
解决方法:
点击cmd黑框右上角-默认值-取消勾选“快速编辑模式” ,重启程序 即可!
下一个版本,会自动处理此问题不需要手动设置!
玩转PDF之 ocr3000 重度ocr批量识别爱好者的福音!相关推荐
- [软件工具]OCR批量识别图片提取文字信息提取号码编号单号软件使用教程
当你有很多图片,但是想提取这些图片里面的手机号或者编号或者快递单号,或者是其他一些信息时候这个工具就很有用了,一般都是通过打开图片一张一张去查看手动输入信息,但是图片很多时候基本就是个体力活,十分不方 ...
- 图片PDF转文字需要进行OCR文字识别
1.天若ocr(最强,都是和adobe pdf 快捷键f4冲突) 2.汉王orc(离线,拖入软件里识别) 3.白描(手机识别汉字强) 4.abbyy finereader(国外老牌,离线外文优秀,手机 ...
- qpushbutton里面的文字怎么换行_ipad读PDF必备,OCR局部识别文字并快速提取,免费的buff你要不要?...
随着苹果硬件和软件的不断开发更新,ipad已经成为不少人的生产力工具之一了.相信很多朋友都免不了拿它来阅读PDF文件,但并不是所有PDF都是可以直接提取其中的文字的,而我们往往又会有这方面的需求.对于 ...
- PDF批量识别OCR,Adobe acrobat pro批量识别pdf
搜索了很久也没有找到批量识别海量pdf文件的方法,结果在adobe的官方找到了"动作" 这个功能. adobe acrobat pro是全世界最好的识别中文的软件,没有之一. 走的 ...
- .net core word转pdf_Enolsoft PDF to Word with OCR for Mac(PDF转Word软件)
Enolsoft PDF to Word with OCR mac版是Macos上一款功能强大的PDF转Word软件,这款软件可以通过ocr技术将pdf文件扫描并转换为word文档,不管你要转换的pd ...
- Enolsoft PDF Converter with OCR Mac(PDF格式转换及OCR识别软件)
Enolsoft PDF Converter with OCR Mac是一款专为Mac用户所设计的PDF格式转换及OCR识别软件,PDF Converter with OCR Mac特别版支持将PDF ...
- 如何用OCR文字识别软件将PDF转换成Excel
最近老板老是让小编处理PDF文件,这OCR识别软件咱也不懂,也不敢问,只能一字一字的码在Excel上,但是这波操作效率不高,还没完成任务,老板又发了一堆PDF文件需要处理,怎么办呢? 跟朋友说了这事后 ...
- ABBYY FineReader 15标准版OCR文字识别及PDF编辑软工具
ABBYY FineReader PDF提供的不仅仅是基本的文档转换.经过28年的上市和1亿次安装,我们不断开发和改进以最新人工智能为核心的OCR技术工具,为您提供前所未有的文档控制水平,这些文档是1 ...
- VBA批量OCR识别提取身份证照片信息_白描网页版 - 高效准确且免费的OCR文字识别工具...
遇到无法复制的文字怎么办?今天推荐一款实用的OCR文字扫描识别利器. 介绍 白描是一款像猫一样灵动的OCR扫描识别神器.具有高准确度的文字识别.表格识别转Excel.批量识别.识别后翻译.文件扫描等功 ...
最新文章
- 京东智能情感客服挽救一名学生生命,“可信赖的AI”用温暖前行
- 弹指之间 -- Waltz
- Win10系列:JavaScript 的 WinJS库
- php网页打开输入密码,PHP输入密码查看网页
- C++函数声明和定义
- Spring Boot 2.x(十五):Dubbo + Zookeeper + Dubbo Admin
- java一个界面用另一个界面的值_如何将参数/值从一个弹出窗口传递到Angular2中的另一个弹出窗口...
- laravel 获取最后一条sql的小函数
- html库存代码,库存汇总.html
- c语言经典题(期中/期末复习)(xdoj)
- 图像处理笔记2-直方图与直方图均衡化histogram equalization
- 技术人的充电时刻,200分钟QA交流,尽在SDCC 2017·深圳站
- EXCEL实用技巧-多条件求和、多条件计数、多条件查找
- 微信输出日志在电脑桌面
- 网易im即时通讯 移动端嵌入web
- 使用Ventoy安装Deepin系统出现Error verification failed 0x1A Security violation错误
- Leetcode2169. 得到 0 的操作数
- Python实现气象天气数据采集与分析【定时邮件发送最新天气提醒+基于时间轴制作Gif天气演变图】
- baxter机器人连接
- python 组合优化 回撤最小_【揭秘专业投资者的武器】经典组合优化模型 在行业资产配置中的应用示例...