最近在和一个朋友聊天时候,偶然了解到她为了把pdf/png转成word,特地开了一个WPS的会员(她是做行政岗的,经常需要把文档转换成word),于是我给她写了一个pdf/png转word的代码,速度又快又免费。

既然有"好东西",怎么能不和我的小伙伴们分享呢,来看下整个实现的过程。step1 首先需要我们申请下百度文字识别的API如下图,其中APP_ID,API_KEY,SECRECT_KEY是我们后面要用到的:

step2 安装所需的模块:

# 这三个python中默认已安装,所以不用安装了
import sys
import os
import globpip install docx
pip install PIL
pip install baidu-aip
pip install pdf2docx# 在安装aip这个模块时,差点坑到我,模块真实名字叫做baidu-aip,
# 调用的时候却是aip,这真TM狗。# 加载需要的功能函数
import sys
import os
import glob
from docx import Document
from os import path
from aip import AipOcr
from PIL import Image

step3 开始写pdf/png转word的函数:


# png 转 word
def baiduOCR(picfile, outfile):"""利用百度api识别文本,并保存提取的文字picfile:    图片文件名outfile:    输出文件名"""# step1 配置api信息APP_ID = 'xxx'API_KEY = 'xxxxxxxx'SECRECT_KEY = 'xxxxxxxxxxxxxx'client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)# step2 图片识别参数设置及调用apifilename = path.basename(picfile)imgRead = open(picfile, 'rb').read()print("正在识别图片:\t" + filename)""" 可选参数 """options = {"language_type": "CHN_ENG","detect_direction": "true","detect_language": "true","probability": "true"}message = client.basicAccurate(imgRead,options=options)   # 通用文字高精度识别print("识别成功!")# step3 结果保存if path.exists(outfile):os.remove(outfile)document = Document()for text in message["words_result"]:document.add_paragraph(text["words"])document.save(outfile)
baiduOCR(picfile, outfile)
# picfile:你实际的png文件名
# outfile:输出结果的文件名# pdf 转 word
from pdf2docx import Converter
pdf_file = './example/test.pdf'
docx_file = './sample.docx'# convert pdf to docx
cv = Converter(pdf_file)
cv.convert(docx_file,start=0, end=None)     # all pages by default
cv.close()

是不是很简单,几行代码搞定,你可以根据自己的情况,进一步封装一下,如果你只需要把pdf转word,只需要安装pdf2docx就可以啦,使用贼方便!有问题可以随时私聊我哦!都看完了,不关注+点赞一下嘛!

教你批量快速实现pdf/png转word相关推荐

  1. python批量将pdf转成word_如何快速将PDF格式转为Word?

    原标题:如何快速将PDF格式转为Word? 有同学问,怎么可以把PDF的格式转换为Word格式呢?我记得以前好像推荐过一些工具.其实,有很多种方法可以把word转换为PDF文件格式. 第一种方法是:利 ...

  2. 在线快速将pdf转换成word

    在线快速将pdf转换成word 处理同样1000个PDF文件的格式转换,在线PDF转换成Word转换器比普通PDF转换器快8-12倍以上,是一款全自动化的转换模式,为用户提供了高质量的PDF转换服务的 ...

  3. 如何快速将PDF文件转换为Word文档

    PDF文件是一个广泛使用的电子文档格式,其被广泛应用于各种领域,包括教育.商业和政府.虽然PDF文件非常实用,但有时你需要将其转换为Word文档,以便更方便地编辑和处理.以下是几种快速将PDF文件转换 ...

  4. 怎样快速将pdf转换成word转换器在线

    怎样快速将pdf转换成word转换器在线 闲暇时候上网下载资料,发现绝大多数的文章都是以PDF格式发布的,使用复制粘贴的方法虽然可以将文字.图片等信息转移到Word文档中,但原PDF文档中的格式.编排 ...

  5. 安利几个小妙招教你如何快速翻译PDF文件

    相信大家在网上查阅外国资料的时候,会发现很多网站上的资料都是以PDF的文件格式呈现的,这对外语好的小伙伴肯定就没啥影响,但是对于我们这种半吊子来说可就不友好了啊.大多数时候只能一点一点码字翻译,简直浪 ...

  6. 看这里,教你如何快速将pdf文件翻译成中文

    因为网上下载的PDF资料,往往掺杂着一些英文,所以中英文翻译是一件很平常的事,毕竟不是每个人的英文都那么好,轻轻松松的就能够看完一篇英文的文件,那么,我们就要寻找翻译工具来帮助我们看完了,那么如何将P ...

  7. LinkPdf转换器-PDF转换成Word使用教程

    PDF文件是一款常用的文件格式,但是怎样编辑一直是个问题.大多数人会选择将PDF转换成Word,来解决PDF无法编辑的难题.可PDF文件怎样快速转换成Word文档? 目前,能够快速将PDF转换成Wor ...

  8. pdf转成word | ppt | jpg图片,免费一键转换教程

    我不允许真的还有人不知道如何免费将pdf转成 ppt.word 或者 jpg图片! 职场小伙伴是不是会经常遇到pdf怎么转成word,pdf怎么转成word,pdf怎么jpg图片等问题?别再为pdf转 ...

  9. 教你急速快速批量插入1000万条数据到mysql数据库表面试题

    急速快速批量插入1000万条数据到mysql数据库表面试题 教你急速快速批量插入1000万条数据到mysql数据库表&面试题 我用到的数据库为,mysql数据库5.7版本的 1.首先自己准备好 ...

最新文章

  1. Linux命令行笔记
  2. 常用转录组组装软件集合
  3. 【Linux基础 01】Linux 下的文件系统
  4. nginx配置ssl加密(单双向认证、部分https)
  5. Qt Creator与调试器进行交互
  6. 【转】解决svn Authorization failed错误
  7. 前端学习(659):小结
  8. 软件项目管理第三课—如何应对投标书的软件功能报价
  9. 基于 CoreAudio 的音频编解码(一):音频解码
  10. php限制下载文件格式,php下载文件源代码(强制任意文件格式下载)_PHP教程
  11. oracle rac redo log,RAC共享online redo log和archived log的官方说明
  12. docker kibana mysql_docker 安装常用组件:[redis,mysql,mongodb,elasticsearch,kibana,exceptionless]...
  13. oracle 表或视图不存在
  14. 自创一种新的方法建立 平衡二叉树(AVL)
  15. mysql undo表空间增长_undo表空间太大解决办法
  16. Windows7开机加速全攻略
  17. 翻翻git之---实用工具类Lazy(绝对的好东西,走过路过别错过)
  18. 拼音加加在双拼状态下在输入数字后的标点不正常的解决方式
  19. 一键磨皮插件:DR5白金版(支持ps 2022)中文版
  20. 学硕计算机可考大数据博士吗,专硕考博比学硕考博难度更大吗?听听上岸的人怎么说...

热门文章

  1. cesium 笛卡尔坐标(单位:米) 与 经纬度(单位:弧度/度) 之间的转换。
  2. linux下安装aMule
  3. MAC下build Janus
  4. 睿智的目标检测56——Pytorch搭建YoloV5目标检测平台
  5. Spring源码阅读一——IOC
  6. 【国家参考文献标准GB/T 7714—2015】
  7. 淮阴工学院计算机考研资料汇总
  8. 【NDK】【019】NDK使用cmath库
  9. 湖南11岁程序员很猛,要逆天的节奏
  10. MPC模型预测控制原理和Matlab以及Python代码实现