教你批量快速实现pdf/png转word
最近在和一个朋友聊天时候,偶然了解到她为了把pdf/png转成word,特地开了一个WPS的会员(她是做行政岗的,经常需要把文档转换成word),于是我给她写了一个pdf/png转word的代码,速度又快又免费。
既然有"好东西",怎么能不和我的小伙伴们分享呢,来看下整个实现的过程。step1 首先需要我们申请下百度文字识别的API如下图,其中APP_ID,API_KEY,SECRECT_KEY是我们后面要用到的:
step2 安装所需的模块:
# 这三个python中默认已安装,所以不用安装了
import sys
import os
import globpip install docx
pip install PIL
pip install baidu-aip
pip install pdf2docx# 在安装aip这个模块时,差点坑到我,模块真实名字叫做baidu-aip,
# 调用的时候却是aip,这真TM狗。# 加载需要的功能函数
import sys
import os
import glob
from docx import Document
from os import path
from aip import AipOcr
from PIL import Image
step3 开始写pdf/png转word的函数:
# png 转 word
def baiduOCR(picfile, outfile):"""利用百度api识别文本,并保存提取的文字picfile: 图片文件名outfile: 输出文件名"""# step1 配置api信息APP_ID = 'xxx'API_KEY = 'xxxxxxxx'SECRECT_KEY = 'xxxxxxxxxxxxxx'client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)# step2 图片识别参数设置及调用apifilename = path.basename(picfile)imgRead = open(picfile, 'rb').read()print("正在识别图片:\t" + filename)""" 可选参数 """options = {"language_type": "CHN_ENG","detect_direction": "true","detect_language": "true","probability": "true"}message = client.basicAccurate(imgRead,options=options) # 通用文字高精度识别print("识别成功!")# step3 结果保存if path.exists(outfile):os.remove(outfile)document = Document()for text in message["words_result"]:document.add_paragraph(text["words"])document.save(outfile)
baiduOCR(picfile, outfile)
# picfile:你实际的png文件名
# outfile:输出结果的文件名# pdf 转 word
from pdf2docx import Converter
pdf_file = './example/test.pdf'
docx_file = './sample.docx'# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file,start=0, end=None) # all pages by default
cv.close()
是不是很简单,几行代码搞定,你可以根据自己的情况,进一步封装一下,如果你只需要把pdf转word,只需要安装pdf2docx就可以啦,使用贼方便!有问题可以随时私聊我哦!都看完了,不关注+点赞一下嘛!
教你批量快速实现pdf/png转word相关推荐
- python批量将pdf转成word_如何快速将PDF格式转为Word?
原标题:如何快速将PDF格式转为Word? 有同学问,怎么可以把PDF的格式转换为Word格式呢?我记得以前好像推荐过一些工具.其实,有很多种方法可以把word转换为PDF文件格式. 第一种方法是:利 ...
- 在线快速将pdf转换成word
在线快速将pdf转换成word 处理同样1000个PDF文件的格式转换,在线PDF转换成Word转换器比普通PDF转换器快8-12倍以上,是一款全自动化的转换模式,为用户提供了高质量的PDF转换服务的 ...
- 如何快速将PDF文件转换为Word文档
PDF文件是一个广泛使用的电子文档格式,其被广泛应用于各种领域,包括教育.商业和政府.虽然PDF文件非常实用,但有时你需要将其转换为Word文档,以便更方便地编辑和处理.以下是几种快速将PDF文件转换 ...
- 怎样快速将pdf转换成word转换器在线
怎样快速将pdf转换成word转换器在线 闲暇时候上网下载资料,发现绝大多数的文章都是以PDF格式发布的,使用复制粘贴的方法虽然可以将文字.图片等信息转移到Word文档中,但原PDF文档中的格式.编排 ...
- 安利几个小妙招教你如何快速翻译PDF文件
相信大家在网上查阅外国资料的时候,会发现很多网站上的资料都是以PDF的文件格式呈现的,这对外语好的小伙伴肯定就没啥影响,但是对于我们这种半吊子来说可就不友好了啊.大多数时候只能一点一点码字翻译,简直浪 ...
- 看这里,教你如何快速将pdf文件翻译成中文
因为网上下载的PDF资料,往往掺杂着一些英文,所以中英文翻译是一件很平常的事,毕竟不是每个人的英文都那么好,轻轻松松的就能够看完一篇英文的文件,那么,我们就要寻找翻译工具来帮助我们看完了,那么如何将P ...
- LinkPdf转换器-PDF转换成Word使用教程
PDF文件是一款常用的文件格式,但是怎样编辑一直是个问题.大多数人会选择将PDF转换成Word,来解决PDF无法编辑的难题.可PDF文件怎样快速转换成Word文档? 目前,能够快速将PDF转换成Wor ...
- pdf转成word | ppt | jpg图片,免费一键转换教程
我不允许真的还有人不知道如何免费将pdf转成 ppt.word 或者 jpg图片! 职场小伙伴是不是会经常遇到pdf怎么转成word,pdf怎么转成word,pdf怎么jpg图片等问题?别再为pdf转 ...
- 教你急速快速批量插入1000万条数据到mysql数据库表面试题
急速快速批量插入1000万条数据到mysql数据库表面试题 教你急速快速批量插入1000万条数据到mysql数据库表&面试题 我用到的数据库为,mysql数据库5.7版本的 1.首先自己准备好 ...
最新文章
- Linux命令行笔记
- 常用转录组组装软件集合
- 【Linux基础 01】Linux 下的文件系统
- nginx配置ssl加密(单双向认证、部分https)
- Qt Creator与调试器进行交互
- 【转】解决svn Authorization failed错误
- 前端学习(659):小结
- 软件项目管理第三课—如何应对投标书的软件功能报价
- 基于 CoreAudio 的音频编解码(一):音频解码
- php限制下载文件格式,php下载文件源代码(强制任意文件格式下载)_PHP教程
- oracle rac redo log,RAC共享online redo log和archived log的官方说明
- docker kibana mysql_docker 安装常用组件:[redis,mysql,mongodb,elasticsearch,kibana,exceptionless]...
- oracle 表或视图不存在
- 自创一种新的方法建立 平衡二叉树(AVL)
- mysql undo表空间增长_undo表空间太大解决办法
- Windows7开机加速全攻略
- 翻翻git之---实用工具类Lazy(绝对的好东西,走过路过别错过)
- 拼音加加在双拼状态下在输入数字后的标点不正常的解决方式
- 一键磨皮插件:DR5白金版(支持ps 2022)中文版
- 学硕计算机可考大数据博士吗,专硕考博比学硕考博难度更大吗?听听上岸的人怎么说...