python-docx是一个在Python环境下读写word文档的“利器”。在使用前可以通过 pip install python-docx 命令安装,再通过import docx 引用即可。下面简单介绍一下 python-docx 的基本操作。

1、新建/打开及保存

文档的新建和打开比较简单,只需要用docx的Document类,若指定路径则是打开文档;若没有指定路径则是新建文档。

对文档的操作结束后可以通过Document类的save方法进行保存,其中参数是保存的文件路径,或者要保存的文件流。一般指定路径即可。

doc = docx.Document('D:\project\python\docx\test.docx') #打开文档
doc_new = docx.Document()  #新建文档doc.save()  #保存
doc_new.save('D:\project\python\docx\1.docx')  #保存

2. 对象操作

python-docx包含了word文档的相关对象集合,如段落(doc.paragraphs)、表格(doc.tables)、节(doc.sections)、样式(doc.styles)、内置图形(doc.inline_shapes)等等。我们可以通过这些对象集合进行信息读取。在这里我主要说一下段落和表格的操作吧。

2.1

【python-docx】Python读写Word文件相关推荐

  1. python读取docx文件出错_Python:读取 .doc、.docx 两种 Word 文件简述及“Word 未能引发事件”错误...

    Python 中可以读取 word 文件的库有 python-docx 和 pywin32. 优点 缺点 python-docx 跨平台 只能处理 .docx 格式,不能处理.doc格式 pywin3 ...

  2. Python使用openpyxl读写excel文件

    Python使用openpyxl读写excel文件 Python使用openpyxl读取excel文件中数据 Python使用openpyxl往excel文件中写入数据 Python使用openpyx ...

  3. Python 使用netCDF4读写nc文件以及截取指定经纬度范围内的数据生成新的nc文件

    Python 使用netCDF4读写nc文件以及截取nc文件经纬度范围内的数据 简单介绍nc文件的读写操作,以及实现输入nc文件和坐标范围,输出一个新的nc文件的功能 环境 python3.8.13 ...

  4. JAVA Apache POI解析docx格式的word文件并提取带样式文本

    关于JAVA Apache POI读取word文档,网上资料很多,但是大多数还是仅仅提取文档中的纯文本,好一点的,也就提取所有图片,但是,word文档本身是具有样式的,这样简单粗暴的提取就会丢失字体. ...

  5. 使用python将doc的word文件转换成docx文件

    文章目录 一.学习目标: 二.直接转换代码: 一.学习目标: 主要之前使用python提起word的docx的文件的数据.但是今天发现,如果是doc后缀的word文件,会报错,这样就无法提取数据了,然 ...

  6. 应用python的docx模块解析word文件内容

    目录 工作问题 涉及知识点 实现过程 目标 调用对应的库和模块 定义通用方法 1.[遍历全部的同格式文件]返回一个文件夹内,限定某类格式文件,返回全部这类文件的绝对路径 2.[提取段落&表格中 ...

  7. Python+pywin32批量转换Word文件为PDF文件

    代码功能:把当前文件夹中多个Word文件批量转换为PDF文件 技术原理:代码实际上是调用了Word的"导出"功能,模拟了手工转换的操作并实现了自动化,要求已正确安装Python扩展 ...

  8. python读csv-python读写csv文件

    1用python做数据分析,数据来源一般会有多种格式,而我喜欢以CSV的方式进行存储分析,如果数据本身就是CSV格式的那我可以直接用pandas库自带的方法进行读取即可,但是有时候各种来源的数据不方便 ...

  9. Python外(4)-读写mat文件

    读写mat文件 1.读取 2.写入 .mat 是matlab中数据存储的标准格式,Python中能够通过库scipy读取和保存. 导入scipy库 from scipy import io 1.读取 ...

最新文章

  1. Java动态代理和静态代理区别
  2. 作为一个Linux/Unix程序员有哪些要求
  3. 回调函数在MFC中的使用
  4. 153. Find Minimum in Rotated Sorted Array
  5. 二分查找、upper_bound、lower_bound
  6. 直播实录 | AAAI 2018论文解读:零资源机器翻译的最新进展
  7. Java 读写 hdfs文件或者目录
  8. Apache整合Tomcat
  9. mysql源码_MySql轻松入门系列——第一站 从源码角度轻松认识mysql整体框架图
  10. Nginx性能优化功能- Gzip压缩(大幅度提高页面加载速度)
  11. pygame精灵组有哪些方法_利用 pygame 开发一款游戏:「跳跳兔」(六)
  12. Jetson开发实战记录(二):Jetson Xavier NX版本区别以及烧录系统
  13. Adobe Photoshop CS6 仅需要两个步骤快速去除图片中的文字
  14. 股权激励与期权激励的区别是什么?
  15. MySQL索引底层实现原理 MyISAM非聚簇索引 vs. InnoDB聚簇索引
  16. Ubuntu16.04的图形化界面系统安装+NIVIDIA驱动安装-Cuda-Cudnn+教程全(后面安装系统通用)
  17. Quartus II建立新工程流程,Quartus如何建立工程?
  18. 16.数据统计之数据分组方法
  19. python用logging模块写循环日志
  20. 教大家如何安装win to go

热门文章

  1. MySQL ERROR1118报错详解
  2. CreateThread、_beginthreadex和AfxBeginThread 的区别
  3. 海昇智:想提升拼多多店铺权重商家该怎么做?
  4. css使图片有3d效果,利用CSS3实现3D倾斜视差图片展示特效
  5. Hibernate的SessionFactory和Session
  6. 尚硅谷H5+CSS3基础课笔记二(CSS部分)
  7. 高一计算机应用基础知识点,计算机应用基础知识点
  8. 解决Ubuntu14.04下Chromium安装Flash播放器
  9. 【倾斜目标检测】PP-YOLOE-R
  10. 拼图游戏--更改项目后的需求分析