python的功能真是强大,可以做词云图、可以优雅地八卦、可以做游戏外挂、还可以将PDF转化成图片,这个功能你还不知道吧,赶紧随小编我一起来看看吧:

之前收集了很多优秀的 PDF文档,但是需要看的时候不是很方便,需要去找到这个文件,如果是在手机上的话往往还需要下载 PDF相关的插件才行,而且最大的问题是不便于资料的整理和分享。如果能够将 PDF转换成网页,岂不是就能解决这些问题了?还能直接分享出去。

这里利用 PyPDF包来处理 PDF文件,为了方便快捷,我这里直接将一个页面转换成图片,就不需要去识别页面中的每一个 PDF元素了,这是没必要的。

转换

核心代码很简单,就是将 PDF文件读取出来,转换成 PdfFileReader,然后就可以根据 PyPDF2的API去获得每一个页面的二进制数据,拿到二进制数据过后,就能很方便的进行图片处理了,这里用 wand包来进行图片处理。

# -*- coding: utf-8 -*-
import io
from wand.image import Image
from wand.color import Color
from PyPDF2 import PdfFileReader, PdfFileWriter
memo = {}
def getPdfReader(filename):
reader = memo.get(filename, None)
if reader is None:
reader = PdfFileReader(filename, strict=False)
memo[filename] = reader
return reader
def _run_convert(filename, page, res=120)

如何利用Python将PDF转化为图片?相关推荐

  1. python将pdf转化为图片格式,可指定清晰度

    安装fitz库 pip install fitz -i https://pypi.douban.com/simple 运行以下代码,会读取当前代码所在的路径下的,pdf文件.并将图片生成到该路径下 i ...

  2. 如何用python修改pdf内容_如何利用python将pdf文件转化为txt文件?

    https://www.wukong.com/answer/6579491774144708872/?iid=15906422033&app=news_article&share_an ...

  3. 利用python将PDF转为PPT(课件专用)

    利用python将PDF转为PPT(课件专用) 前言:课程中老师经常会将课件作为PDF发放而非PPT,而现有的PDF阅读器一般不支持添加修改等操作,所以显得十分麻烦,考虑将PDF转换为PPT格式,方便 ...

  4. 实用脚本!利用 Python 对 PDF 进行加密、解密操作,代码拿走就用!

    来源/早起Python 本文将分享如何利用 Python 对 PDF 进行加密和解密操作,主要利用到之前多次介绍过的PyPDF2 模块. PDF 加密 在之前的文章PDF合并.拆分.水印.加密中简单提 ...

  5. 利用Python提取PDF文件中的文本信息

    如何利用Python提取PDF文件中的文本信息 日常工作中我们经常会用到pdf格式的文件,大多数情况下是浏览或者编辑pdf信息,但有时候需要提取pdf中的文本,如果是单个文件的话还可以通过复制粘贴来直 ...

  6. Python将PDF转成图片—PyMuPDF和pdf2image

    前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试. 粗略的试了好几种方式,其中语言尝试了Python和Java,总体而言所找到的Python方 ...

  7. pdf转换成jpg python_【PyMuPDF和pdf2image】Python将PDF转成图片PNG和JPG

    公众号:前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试. 粗略的试了好几种方式,其中语言尝试了Python和Java,总体而言所找到的Pyt ...

  8. python 生成pdf 文字和图片_Python系列—PDF文本与图片抽取

    PDF是人们日常使用最多的跨平台文档.其是一种用独立于应用程序.硬件.操作系统的方式呈现文档的文件格式.每个PDF文件包含固定布局的平面文档的完整描述,包括文本.字形.图形及其他需要显示的信息.具有良 ...

  9. 【PyMuPDF和pdf2image】Python将PDF转成图片

    2023-04-30更新 PyMuPDF=1.21.1 import datetime # PyMuPDF=1.21.1 import fitzdef pdf2img(pdf_path, img_pa ...

最新文章

  1. 学习笔记Flink(六)—— Flink DataStream API编程
  2. php判断单选框是否被选中,jquery怎么判断radio是否选中
  3. 普211标准三维EE零基础转CS申
  4. python模块之re正则表达式
  5. 职场潜规则:领导常说的10句话,学会3句以上你不会混的太差!
  6. Sitecore 个性化 - 近距离和过于个人化?
  7. java什么是类和对象,Java类和对象的概念
  8. python 漂亮界面demo_在这个什么都看脸的时代,如何用 GUI 提高 python 程序的颜值?...
  9. 9.3 LSMW程序创建操作手册 第5 6 7步
  10. SAP License:2021年度最新FICO面试题目
  11. Github使用之git回退到某个历史版本
  12. python智能化推荐_windows python flask
  13. [Java初探实例篇02]__流程控制语句知识相关的实例练习
  14. 高校智慧教室建设方案
  15. 微信隐藏代码大全(来源于网络)
  16. 奶爸日记2 - 鑫鑫感动了婆婆
  17. CentOS 7 YUM安装MariaDB 10.1
  18. 三维空间刚体运动——(1)齐次坐标与旋转矩阵
  19. 在img的图片上添加文字
  20. Intel Me更新

热门文章

  1. 自媒体人如何写出10w+爆文,这个工具很有用
  2. 微信撤销订单java,Java微信支付开发之关闭订单
  3. python内置函数open_Python内置函数(47)——open
  4. 可视化神器Plotly绘制树状图
  5. 移动手机端名片扫描识别技术
  6. 数据从excel导入ORACLE的4个方法
  7. 草图大师怎么取消组件关联_sketchup怎样取消关联?
  8. 武汉大学中山大学计算机就业,武汉大学和中山大学之间,应该怎么选择?
  9. OpenDaylight通过netconf对接netopeer2
  10. 公司的工作流程,以及作为测试人员的介入时机