20220109


pdf拆分
不要点提取页面为单独文件 这样会提取出完整的一个文件
而如果选了的话会全部拆分成一页一页

20220107

# code=utf-8
import os
import time
import sys
import fitz
import pdfplumber
from openpyxl import Workbook
from tqdm import tqdm
PATH = r'D:\project_pycharm\medicine_standard_lib/'def analysis_table(pdf_file):# 打开表格workbook = Workbook()sheet = workbook.active# 打开pdfwith pdfplumber.open(pdf_file) as pdf:# 遍历每页pdffor page in tqdm(pdf.pages):# 提取表格信息table = page.extract_table()# print(table)# 格式化表格数据for row in table:# print(row)sheet.append(row)workbook.save(filename="医保药品分类与代码数据库更新202110.pdf.xlsx")analysis_table(PATH+'医保药品分类与代码数据库更新202110.pdf')
抽取表格

https://blog.csdn.net/wxplol/article/details/109304946
基于pymupdf的PDF的文本、图片和表格信息提取

https://mp.weixin.qq.com/s/59UiYl1AJh-kWQOCeeIMHA
各种pdf解析库

https://www.jianshu.com/p/d38f2a582aa8
Python实现PDF内容抽取PyMuPDF

平滑的地方都选上
自定义分辨率
或者用2345 pdf阅读器 很清晰

可以调节显示器的 clear vision 来调节对比度 增加显示效果
模糊的pdf文档会变的清晰

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/xbs150/article/details/84870176
            </div><!--一个博主专栏付费入口--><!--一个博主专栏付费入口结束--><link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css"><link rel="stylesheet" href="https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_views-4a3473df85.css"><div class="htmledit_views" id="content_views"><p><strong>AdobeAcrobat是一款不错的pdf编辑阅读器,大家常用来阅读文献资料,但是在安装完成使用时候,常常出现页面字体不清晰的情况,需要做一下调整:</strong></p>

(1)打开AdobeAcrobat属性中的兼容性设置界面(右击桌面AdobeAcrobat的图标,选择属性,点击兼容性)

(2)对兼容性做如下设置,调整成为程序自动使用高DPI

(3)打开AdobeAcrobat,选择编辑——首选项——页面设置,将分辨率调整成为使用系统设置,渲染部分的平滑文本选择用于显示器,其他的默认打钩。页面布局和缩放类型可以自己调整了看,这里选择自动。

(4)重启AdobeAcrobat即可

如何将模糊的扫描版pdf转为清晰的pdf或word_pdf问题小结相关推荐

  1. 关于pdf文档无大纲的若干解决办法(扫描版书籍/ppt转的pdf)

    关于pdf文档无大纲的若干解决办法(扫描版书籍/ppt转的pdf). girhub 开源pdf-bookmark项目解决大纲问题 使用条件 特点 使用Adobe Acrobat搭配AutoBookma ...

  2. 怎么把pdf转为html?PDF转HTML转换器推荐

      大家知道HTML格式吗?我们通常上网浏览的网页就是HTML格式.而PDF格式是我们常用的一种文件格式,在不同的设备上打开,既不会影响到PDF内容的排版,也不容易被修改.在工作中,有时为了查看PDF ...

  3. PHP将PDF转为TXT文件,pdf转中文txt,pdf中文txt

    pdf转中文txt,pdf中文txt 最近项目需要实现根据关键字搜索pdf内容,实现思路就是提取pdf文本,然后进行索引. 工具上选择: IText 4.16之后采用agpl License,不能用作 ...

  4. 【如何将PDF转为word?PDF文档转换工具来啦!】

    PDF文档转换工具 最近,很多朋友都在找一个功能齐全,易用且免费的PDF文档转换工具,对此小编直接自己写了一个微信小程序,基本可以满足大家日常需求了.看大家的需要,后续可能还会退出pdf合并,加密等功 ...

  5. java pdf 转换 word_Java 将PDF 转为Word、图片、SVG、XPS、Html、PDF/A

    本文将介绍通过Java编程来实现PDF文档转换的方法.包括: 1. PDF转为Word 2. PDF转为图片 3. PDF转为Html 4. PDF转为SVG 4.1将PDF每一页转为单个的SVG 4 ...

  6. Java 将PDF 转为Word、图片、SVG、XPS、Html、PDF/A

    本文将介绍通过Java编程来实现PDF文档转换的方法.包括: 1. PDF转为Word 2. PDF转为图片 3. PDF转为Html 4. PDF转为SVG 4.1 将PDF每一页转为单个的SVG4 ...

  7. Adobe Acrobat Pro将不清晰的pdf转换为文本清晰的pdf

    在查阅文献的时候,经常会需要阅读一些年代久远的经典论文,这些论文往往为扫描版,不够清晰也无法复制,可以用acrobat进行文本的识别并转换为清晰.可复制的内容. 用adobe acrobat打开一篇不 ...

  8. 扫描版模糊pdf优化方法

    扫描版模糊pdf优化方法 前言 扫描版的 pdf 文件,是学习生活非常常见.但是由于 pdf 文件制作水平良莠不齐.有时 pdf 文件显得模糊不堪,严重影响阅读心情,那么该如何优化这样的 pdf 文件 ...

  9. pdf文件【扫描版】转 【文字版】

    我们经常会遇到一些扫描版的pdf文档,想要选中其中的文字进行操作比较麻烦,下面将这种这种扫描版的pdf档转为可搜索的文字档. 这里使用到的软件为 Adobe Acrobat DC 方法: 1. 打开软 ...

最新文章

  1. 手工纸盒子_【创意手工】怒赞!如此有趣的儿童折纸,你不学我学!
  2. python修改linux网卡信息,linux下修改网卡接口名称
  3. 面试题整理17 输入一个字符串判断一个字符串是否是有效ip地址
  4. html兄弟选择器怎么用,CSS的相邻兄弟选择器用法示例讲解
  5. 软件项目管理0710:招标文件准备【求助】
  6. iptables 添加,删除,查看,修改
  7. redis队列缓存 + mysql 批量入库 + php离线整合
  8. Python版九九乘法表
  9. netflix 模式创新_创新设计模式:单例模式
  10. 计算机组成原理知识点白中英,计算机组成原理重点整理(白中英版) 考试必备
  11. 互联网系统性能优化方向
  12. c语言loop until用法,流程控制中的while、until、for循环
  13. create 执行存储过程报错出现符号_记一次数据库迁移的过程采坑过程
  14. c语言用switch做一个计算器,求助。。关于用switch编写简易计算器
  15. Android逐帧动画的实现
  16. 注塑模介绍、设计中文语音多媒体教学光盘 1CD
  17. viper4android md,【xposed】微信主题模块(MDWechat)v3.5.0
  18. vue下鼠标按住滑动
  19. 电脑找回,怎么找回电脑上删除的文件_怎么找回电脑删除的文件-win7之家
  20. 【立创开源】ESP8266制作的1.44寸TFT显示屏太空人天气时钟(st7735)(增加农历显示)(抄作业)

热门文章

  1. 快起床刷题去,别人把你offer拿走啦
  2. Go 运行时(go runtime)的含义
  3. 2022-2028年中国聚硫橡胶行业市场研究及前瞻分析报告
  4. 【Spring】spring基于纯注解的声明式事务控制
  5. scheduled sampling_seq2seq
  6. vue element的若干问题
  7. 多传感器融合:自动驾驶(下)
  8. YOLOV4知识点分析(一)
  9. 一篇学会HttpServletRequest
  10. 大数据调度平台Airflow(八):Airflow分布式集群搭建及测试