【阅读全文】

第三方库说明

# PDF读取第三方库
import pdfplumber# DataFrame 数据结果处理
import pandas as pd

初始化DataFrame数据对象

# 初始化DataFrame数据对象、用于DataFrame数据保存
data_frame = pd.DataFrame()

读取PDF表格

# pdf 文件路径
pdf_file = '/usr/load/data.pdf'# 读取pdf数据
pdf_data = pdfplumber.open(pdf_file)# 遍历PDF数据
for page in pdf_data.pages:# 每一页的Tbale表格数据table = page.extract_table()# 将每一页的数据写入一个DataFrame对象data_frame_page = pd.DataFrame(table[1:], columns=table[0])# 合并每一页的表格数据data_frame = pd.concat([data_frame_page, data_frame], ignore_index=True)# 简单的数据清洗、删除其中列值全部为Nan的数据列
data_frame.dropna(axis=1, how='all', inplace=True)

写入EXCEL表格

# excel 文件路径
excel_path = '/usr/load/data.pdf'# 自定义列名
data_frame.columns = ['姓名', '年龄', '身份证号', '绩效考核']# DataFrame数据保存到Excel数据表中
data_frame.to_excel(excel_writer=excel_path, index=False, encoding='utf-8')

【粉丝福利】关注公众号,获取全套视频资料,使用python的pdf读写功能模块,将从pdf读取的表格内容自定义转换后写入excel文件表格。喜欢小编点个 '关注' 吧!

【往期精选】

● python 中最好用的身份证规则解析工具,地区码、性别、出生年月、身份证编码等快速校验!

● os用法总结:python中必须掌握的内置模块os,实现与计算机操作系统的常规交互!

● python 实用技巧:几十行代码将照片转换成素描图、随后打包成可执行文件(源码分享)

● python十行代码实现文件去重,去除重复文件的脚本

● python的GUI框架tkinter,实现程序员的流氓式表白逻辑

● 探究python函数的不定长参数args与*kwargs

● 没有深思过的python冷知识你知道几个?

● python图片处理,自动生成gif动态图片

● python-redis 的操作手法,相当简单的redis数据存储方式!

● python 日期、时间处理,各种日期时间格式/字符串之间的相互转换究竟是怎样的?

● python 内置的数据计数器Counter相当nice

● 几十行代码实现python发送邮件与接收邮件

● 没有开发工具,在服务器控制台如何进行python代码调试,高级编程pdb代码调试!

● 梳理python路线知识盲区,最全面、最详细的python知识体系框架思维导图终于出炉了!

本文由微信公众号【python 集中营】发布,更多精彩文章、视频资料即可领取!

办公室文员必备python神器,将PDF文件表格转换成excel表格!相关推荐

  1. PDF文件如何转换成Excel表格?试试这个方法

    PDF文件是一种非常常见的文件格式,它被广泛用于电子书.文档.报告和表格等各种用途.虽然 PDF 文件的格式和布局非常稳定和可靠,但是它的文本和表格数据无法直接被编辑和操作.因此,如果你需要将 PDF ...

  2. pdf文件怎么转换成excel格式?

    在办公中文件格式之间的相互转换是很常见的操作方式,就像把不能直接进行编辑的PDF文件转换成excel表格,就可以帮助我们更快更好的做好数据,比起使用传统的编辑方式,显然转换来的效率更高.那pdf文件怎 ...

  3. PDF怎么快速转换成Excel表格文件?两个方法帮你实现

    PDF文件通常是用来呈现.存储文档或图片的格式,而Excel表格则是用于处理.分析和计算数据的工具.当你需要更方便的数据处理和分析,更高效的数据录入,将PDF文件中的表格转换为Excel文件,可以节省 ...

  4. PDF文件可以转换成Excel文件吗

    文件的转换也是我们最常见的了,那么我们在遇到这类问题的时候可以怎么去处理呢?其实是可以借助一些软件来帮助我们进行文件的转换,下面就来给大家介绍一下吧. 为了将PDF文件转换成Excel文件,我们需要使 ...

  5. python 文本转excel_Python 文本(txt) 转换成 EXCEL(xls)

    #!/bin/env python # -*- encoding: utf-8 -*- #------------------------------------------------------- ...

  6. html文件转换html格式,pdf文件怎么转换成html格式

    PDF文件怎么转换成html格式呢?html格式其实就是网页格式,PDF文件和网页文件一般情况下是两种完全不搭边的格式,但是不可否定的是办公室的多样化总有人会有这样的需求,只要有需求就会有其相应的解决 ...

  7. 扫描的PDF文件怎么转换成word

    扫描的PDF文件怎么转换成Word文档?为什么要将PDF文件转换成Word文件呢?很多人在 网上下载资料的时候发现下载的文件多数是PDF格式的,这种文件并不能很好的为我们所用,不能复制不能修改,将其转 ...

  8. 什么文件可以保存成html文件格式,PDF文件可以转换成html格式吗

    原标题:PDF文件可以转换成html格式吗 PDF文件怎么转换成html格式呢?html格式其实就是网页格式,PDF文件和网页文件一般情况下是两种完全不搭边的格式,但是不可否定的是办公室的多样化总有人 ...

  9. mpp文件转换excel_怎么将pdf文件转换成excel表格格式呢?

    在我们的日常工作当中,有的时候偶尔会出现一些商业E-Mail的发送,但是在发送之前我们是需要将PDF文档中的数据内容转换成Excel表格的形式.所以学会将PDF转Excel的方法很重要,那不知道小伙伴 ...

最新文章

  1. python自动化脚本实例100条-自动化运维基础实例解析-Python批量登录到服务器执行任务...
  2. orm mysql_ORM介绍
  3. android通过webservice验证用户 .
  4. vue-:class的几种使用方式
  5. 虚拟机照样飞速跑Windows Server2008
  6. 前端学习(1659):前端系列实战课程之瀑布流实现思路
  7. Win7和Ubuntu14.10双系统
  8. jzoj3736. 【NOI2014模拟7.11】数学题
  9. 如何在aspx页面中插入swf动画
  10. linux技术属于什么系,什么云计算技术?想学好这个必须了解的!
  11. Autolayout屏幕适配——代码实现(苹果公司 / VFL语言 / 第三方框架Masonry)
  12. 原生 JS 撸一个轮播图(支持拖拽切屏)
  13. SPSS中有关相关性分析的介绍(双变量相关分析、偏相关)
  14. 从金蝶k3到金税盘_金蝶k3怎样结转主营业务成本
  15. 13.罗马数字转数字
  16. NAACL 2022 | TAMT:通过下游任务无关掩码训练搜索可迁移的BERT子网络
  17. Spark整理:相关名词解释
  18. 让计算机网络与作文教学,“基于计算机和网络环境下的写作教学研究”课题组  2015-2016学年度上学期研究计划...
  19. 【机器学习】显卡、GPU、NVIDIA、CUDA、cuDNN
  20. 【阿里云短信服务SMS】使用阿里云发送短信

热门文章

  1. 利用计算机技术执行去自动化,分析办公自动化中的计算机技术应用
  2. 计算机动听的音乐响起来,动听音乐响起来.docx
  3. 合成器基础(四) - 其他合成方法
  4. 你的高铁为什么那么准时?——兆亿级大数据精准预判列车故障
  5. [原创]多多返利登陆后台提示验证码错误或无法登陆的解决办法
  6. Qt QWindowsBackingStore::flush: GetDC failed (句柄无效)
  7. Bakery - GPU Lightmapper
  8. 用unity写一个推箱子
  9. stm32g4 下载算法_STM32CubeProgrammer下载算法制作
  10. 淘宝天猫订单的查询与过滤