如何利用Python将PDF转化为图片?
python的功能真是强大,可以做词云图、可以优雅地八卦、可以做游戏外挂、还可以将PDF转化成图片,这个功能你还不知道吧,赶紧随小编我一起来看看吧:
之前收集了很多优秀的 PDF文档,但是需要看的时候不是很方便,需要去找到这个文件,如果是在手机上的话往往还需要下载 PDF相关的插件才行,而且最大的问题是不便于资料的整理和分享。如果能够将 PDF转换成网页,岂不是就能解决这些问题了?还能直接分享出去。
这里利用 PyPDF包来处理 PDF文件,为了方便快捷,我这里直接将一个页面转换成图片,就不需要去识别页面中的每一个 PDF元素了,这是没必要的。
转换
核心代码很简单,就是将 PDF文件读取出来,转换成 PdfFileReader,然后就可以根据 PyPDF2的API去获得每一个页面的二进制数据,拿到二进制数据过后,就能很方便的进行图片处理了,这里用 wand包来进行图片处理。
# -*- coding: utf-8 -*-
import io
from wand.image import Image
from wand.color import Color
from PyPDF2 import PdfFileReader, PdfFileWriter
memo = {}
def getPdfReader(filename):
reader = memo.get(filename, None)
if reader is None:
reader = PdfFileReader(filename, strict=False)
memo[filename] = reader
return reader
def _run_convert(filename, page, res=120)
如何利用Python将PDF转化为图片?相关推荐
- python将pdf转化为图片格式,可指定清晰度
安装fitz库 pip install fitz -i https://pypi.douban.com/simple 运行以下代码,会读取当前代码所在的路径下的,pdf文件.并将图片生成到该路径下 i ...
- 如何用python修改pdf内容_如何利用python将pdf文件转化为txt文件?
https://www.wukong.com/answer/6579491774144708872/?iid=15906422033&app=news_article&share_an ...
- 利用python将PDF转为PPT(课件专用)
利用python将PDF转为PPT(课件专用) 前言:课程中老师经常会将课件作为PDF发放而非PPT,而现有的PDF阅读器一般不支持添加修改等操作,所以显得十分麻烦,考虑将PDF转换为PPT格式,方便 ...
- 实用脚本!利用 Python 对 PDF 进行加密、解密操作,代码拿走就用!
来源/早起Python 本文将分享如何利用 Python 对 PDF 进行加密和解密操作,主要利用到之前多次介绍过的PyPDF2 模块. PDF 加密 在之前的文章PDF合并.拆分.水印.加密中简单提 ...
- 利用Python提取PDF文件中的文本信息
如何利用Python提取PDF文件中的文本信息 日常工作中我们经常会用到pdf格式的文件,大多数情况下是浏览或者编辑pdf信息,但有时候需要提取pdf中的文本,如果是单个文件的话还可以通过复制粘贴来直 ...
- Python将PDF转成图片—PyMuPDF和pdf2image
前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试. 粗略的试了好几种方式,其中语言尝试了Python和Java,总体而言所找到的Python方 ...
- pdf转换成jpg python_【PyMuPDF和pdf2image】Python将PDF转成图片PNG和JPG
公众号:前言:在最近的测试中遇到一个与PDF相关的测试需求,其中有一个过程是将PDF转换成图片,然后对图片进行测试. 粗略的试了好几种方式,其中语言尝试了Python和Java,总体而言所找到的Pyt ...
- python 生成pdf 文字和图片_Python系列—PDF文本与图片抽取
PDF是人们日常使用最多的跨平台文档.其是一种用独立于应用程序.硬件.操作系统的方式呈现文档的文件格式.每个PDF文件包含固定布局的平面文档的完整描述,包括文本.字形.图形及其他需要显示的信息.具有良 ...
- 【PyMuPDF和pdf2image】Python将PDF转成图片
2023-04-30更新 PyMuPDF=1.21.1 import datetime # PyMuPDF=1.21.1 import fitzdef pdf2img(pdf_path, img_pa ...
最新文章
- 学习笔记Flink(六)—— Flink DataStream API编程
- php判断单选框是否被选中,jquery怎么判断radio是否选中
- 普211标准三维EE零基础转CS申
- python模块之re正则表达式
- 职场潜规则:领导常说的10句话,学会3句以上你不会混的太差!
- Sitecore 个性化 - 近距离和过于个人化?
- java什么是类和对象,Java类和对象的概念
- python 漂亮界面demo_在这个什么都看脸的时代,如何用 GUI 提高 python 程序的颜值?...
- 9.3 LSMW程序创建操作手册 第5 6 7步
- SAP License:2021年度最新FICO面试题目
- Github使用之git回退到某个历史版本
- python智能化推荐_windows python flask
- [Java初探实例篇02]__流程控制语句知识相关的实例练习
- 高校智慧教室建设方案
- 微信隐藏代码大全(来源于网络)
- 奶爸日记2 - 鑫鑫感动了婆婆
- CentOS 7 YUM安装MariaDB 10.1
- 三维空间刚体运动——(1)齐次坐标与旋转矩阵
- 在img的图片上添加文字
- Intel Me更新