起始

今天想要通过python对word进行操作,进行到第一步就卡住了半天。
使用的是Python-docx模块,开始出现这个问题,查询发现是该模块只能够处理docx文件,不能处理doc文件。因此想用以下办法进行转化

def docTodocx():path = input('请输入文件路径:')filelist = os.listdir(path) # 加载目录下所有文件,放入列表中print(len(filelist)) # 打印列表长度,检查文件数量是否正确for file in filelist: # 进行循环修改文件名filepath = path + os.sep + file # 拼接文件地址 os.sep 表示系统分隔符fileName = file.split('.')[0]NewFileName = path + os.sep + fileName + '.docx'os.rename(filepath,NewFileName)print(file+'-->'+NewFileName)

后续

执行完毕后,发现文件确实从doc变为docx了,执行 doc = docx.Document(path) 发现仍然报错。

百度查找了很多也没有发现问题所在。
起初我以为是wps的问题,以为该模块必须使用office才可以?
但是查询半天也没有发现有类似的说法。

之后我用docx.Document()直接创建docx文件,写入内容,然后再读取,发现可以读取。

用wps创建docx文件,进行写入读取,也可以操作。我感觉我好像找到问题所在了。

结论

我再次用wps创建了一个doc文件,然后手动修改doc为docx,发现果然又报了错误。

原来,doc和docx并非仅仅是差一个x这么简单,也并非仅仅修改文件名就可以的。仅仅修改文件名,实际上是换汤不换药,docx.Document()仍然无法识别也在所难免。因此需要真实的将doc转为docx。

有几种方法

  1. 手动,一个一个打开doc文件,然后在文件–另存为,选择为docx保存。
  2. 通过一些软件或在线查找转换网站,网上写的有一些,具体我也没找。
  3. 通过设置宏,具体方法我不会,百度自查吧
  4. 通过python的win32com模块,自动打开wps或word,对文件进行保存。代码如下
def doc2docx():path = input('请输入文件路径(绝对路径):')filelist = os.listdir(path)  # 加载目录下所有文件,放入列表中w = wc.Dispatch('kwps.Application')  # 打开wps,如果想要打开Word,将代码换成w = wc.Dispatch('Word.Application')即可# w.Visible = True # 可视化,用来测试print(len(filelist))  # 打印列表长度,检查文件数量是否正确for file in filelist:  # 进行循环修改文件名filepath = path + os.sep + file  # 拼接文件地址 os.sep 表示系统分隔符print(filepath)doc = w.Documents.Open(filepath)fileName = file.split('.')[0]NewFileName = path + os.sep + fileName + '.docx'print(NewFileName)doc.SaveAs2(NewFileName, 12)time.sleep(1)doc.Close()w.Quit()

docx.opc.exceptions.PackageNotFoundError:相关推荐

  1. docx.opc.exceptions.PackageNotFoundError: Package not found at ‘文件名.docx‘ 问题解决

    docx.opc.exceptions.PackageNotFoundError: Package not found at '文件名.docx' 问题解决 参考文章: (1)docx.opc.exc ...

  2. Docx:docx.opc.exceptions.PackageNotFoundError: Package not found at

    Docx:docx.opc.exceptions.PackageNotFoundError: Package not found at:https://blog.csdn.net/python__re ...

  3. docx.opc.exceptions.PackageNotFoundError: Package not found at

    docx.opc.exceptions.PackageNotFoundError: Package not found at 'C:\Users\13298\Desktop\structure\202 ...

  4. python 读docx文件 报错 docx.opc.exceptions.PackageNotFoundError: Package not found at

    1.简单一句话就是:自己手动创建的docx 文档可以正常Document(docx)读取,但是通过python 将doc 转换成docx 后,Document(docx )就会报错,所以我们可以手动创 ...

  5. python-docx使用document读取文件报错:docx.opc.exceptions.PackageNotFoundError: Package not found at

    文章目录 报错详情 原因 解决办法 疑问 报错详情 原因 执行到document=Document(word_path)时报错,python-docx模块无法读取该docx文件 def open_fi ...

  6. python 读取word 题库_Python-docx 读取word.docx内容

    第一次写博客,也不知道要写点儿什么好,所以就把我在学习Python的过程中遇到的问题记录下来,以便之后查看,本人小白,写的不好,如有错误,还请大家批评指正! 中文编码问题总是让人头疼,想要用Pytho ...

  7. Python 第三方库之docx

    日常上官网 https://python-docx.readthedocs.io/en/latest/ 一.安装 pip install python-docx 二.写入word word 中主要有两 ...

  8. python docx包_[Python02] Python-docx包的使用,快速处理 Word 文件!

    日常需要经常处理Word文档,发现了一个新的Python包:Python-docx,处理docx十分方便. 而且这个包和pandas包结合使用,可以在word插入excel表格,节省了很多复制.粘贴. ...

  9. python rtftotxt_利用python将docx文件转为txt

    背景:工作中需要将文件夹下的若干word文件docx转换为对应txt文本格式 因此需要将docx中文本读取出来,然后保存为txt格式即可 转换docx文件 需要的python模块为python-doc ...

  10. python——读取docx文档wordcloud生成词云并进行词频统计

    文章目录 环境准备 导入库 读取docx并进行分词 词频 词云 设置背景图片(可选) 生成词云 保存词云并显示 环境准备 # 不是docx,是python-docx!!!!!!! pip instal ...

最新文章

  1. ActivePython2.7 +Firefly1.2.2+WIN7服务器搭建过程(已通过)
  2. RHEL6入门系列之十一,内/外部命令、重定向、管道
  3. MariaDB10 主从配置
  4. C/C++中善用大括号
  5. C++STL与泛型编程 侯捷 (1)
  6. Core DES加、解密
  7. 专科python应届生工资多少-请问学过一点python,应届生怎么找工作?
  8. python同时输出名字和时间_Python练习小工具——根据Exif的拍摄时间和设备名批量重命名照片...
  9. 计算机工具栏文件夹选项在哪里,windows10系统下工具栏里找不到文件夹选项如何解决...
  10. Postman汉化中文版
  11. 【C语言】学习gotoxy() 与 clrscr() 函数
  12. C语言每日一练——第118天:百钱百鸡问题
  13. 极课大数据:培养超级学生,不如打造超级教师
  14. ImportError: No module named PyQt4.
  15. Latex语法学习02:文本悬挂缩进
  16. 你是真的“C”——详解C语言函数模块知识(上篇)
  17. 神经网络和pid有什么区别,基于神经网络的pid控制
  18. Caused by: org.xml.sax.SAXParseException;必须为元素类型 mapping 声明属性 resourse。
  19. 《从案例中学习JavaScript》之实现网页版阅读器
  20. PHP下载APK文件

热门文章

  1. 为什么开发团队喜欢Scrum?
  2. 2021年全球与中国汽车ACC系统行业市场规模及发展前景分析
  3. 【图像融合】基于对比度增强结合多尺度边缘保持分解红外与可见光图像融合含Matlab源码
  4. JS笔记-常见函数与问题
  5. js对数组对象的操作以及方法的使用
  6. android调试程序定位崩溃,android – 当我尝试调试[重复]时应用程序崩溃
  7. Ubuntu 安装网络扫描和嗅探工具包 Nmap
  8. 对我影响很大的博客(持久更新)
  9. pytorch基于Unet的铁轨缺陷语义分割
  10. --☆☆PNG库即拿即用☆☆-- 智慧大屏素材 | BI PNG素材 | 大屏鉴赏 | 大数据可视化