需求驱动

我写了很多文章,用docx来保存,现在想把他放到博客上,我该怎么做?复制粘贴?不!我要格式转换!

DOCX转换成HTML

from pydocx import PyDocX
html = PyDocX.to_html(r"E:\工作管理\环境搭建\文档上传\格式转换\test.docx")
f = open("test.html", 'w', encoding="utf-8")
f.write(html)
f.close()

如上图已经生成文件,我们看看效果:

如上图,效果还是不错的。

HTML转换成markdown

from pydocx import PyDocX
import html2text as hthtml = PyDocX.to_html(r"E:\工作管理\环境搭建\文档上传\格式转换\test.docx")
f = open("test.html", 'w', encoding="utf-8")
f.write(html)
f.close()text_maker = ht.HTML2Text()
text_maker.bypass_tables = False
path =r"E:\工作管理\环境搭建\文档上传\格式转换\test.html"
htmlfile = open(path,'r',encoding='UTF-8')
htmlpage = htmlfile.read()
text = text_maker.handle(htmlpage)
md = text.split('#')
open("test.md","w").write(md[1])

Python将DOCX转换为markdown文件相关推荐

  1. Word处理控件Aspose.Words功能演示:在 Java 中将 Word DOCX 转换为 Markdown

    如今,Markdown ( MD ) 格式被广泛用于编写在线文章.博客和文档.但是,在大型文档的情况下,它的语法变得难以记忆和书写.为方便起见,您可以在 MS Word 中编写内容,然后将DOCX文件 ...

  2. 将py文件转换成html,(2条消息)自制 Python小工具 将markdown文件转换成Html文件

    今天看到了一个Python库,名为markdown.瞬间就给了我一个灵感,那就是制作一个将markdown文件转换成html文件的小工具. 我的实验环境操作系统: Windows 7 64位 旗舰版 ...

  3. python将图片转换为PDF文件

    工作中需要将众多图片转换为PDF文件,在线的各种工具又感觉不是很安全,于是就想到用python写一个小工具, 完成批量图片转换PDF功能. 主要使用python的fitz插件,通过在命令行输入pip ...

  4. 使用python讲二进制转换为音频文件_Python使用ffmpy将amr格式的音频转化为mp3格式的例子...

    最近做了一个项目,将从微信下载的音频文件(默认为.amr格式)转化为mp3格式(否则前端播放将会遇到困难)上传到云端.经过一番研究,最终决定采用Python的ffmpy包. 安装只需执行 pip in ...

  5. Word doc/docx 格式文件转换为 MarkDown

    异想之旅:本人原创博客完全手敲,绝对非搬运,全网不可能有重复:本人无团队,仅为技术爱好者进行分享,所有内容不牵扯广告.本人所有文章仅在CSDN.掘金和个人博客(一定是异想之旅域名)发布,除此之外全部是 ...

  6. labeme批量转换json文件_Python实现markdown文件批量转换为word

    Python实现markdown文件批量转换为word 正所谓,不会markdown的技术员不是老司机,自从用上markdown之后,人生又到了一波小高峰.有好东西怎么能不共享之,因此随之我不断的普( ...

  7. python rtftotxt_利用python将docx文件转为txt

    背景:工作中需要将文件夹下的若干word文件docx转换为对应txt文本格式 因此需要将docx中文本读取出来,然后保存为txt格式即可 转换docx文件 需要的python模块为python-doc ...

  8. python docx与doc 文件互相转换

    因文件格式要求,需要将docx 与doc文件相互转换,特寻找python代码,与大家共分享 from win32com import client#转换doc为docx def doc2docx(fn ...

  9. python批量操作word文档实战_python批量实现Word文件转换为PDF文件

    本文为大家分享了python批量转换Word文件为PDF文件的具体方法,供大家参考,具体内容如下 1.目的 通过万能的Python把一个目录下的所有Word文件转换为PDF文件. 2.遍历目录 作者总 ...

最新文章

  1. 生成Gif动画缩略图-Gif动画水印的改进
  2. “智能经济”浪潮下,百度为何强调“人格化”与“服务化”?
  3. [转]Android中dp,px,sp概念梳理以及如何做到屏幕适配
  4. html怎么查看两个块的距离,两个东西之间的距离怎么控制
  5. 通过导入txt数据画出python turtle图形_【Python】txt文件读取绘画
  6. Leetcode-5199 Smallest String With Swaps(交换字符串中的元素)
  7. AT指令联网---以鸿蒙开发板为例
  8. Python学习week4-set集合
  9. 接口中的静态方法作用_接口一定要实现,才能为自己所用
  10. asp,jsp,php等web开发必懂技术---什么时候使用静态页,什么时候必须使用动态页...
  11. hdu 1394 Minimum Inversion Number
  12. 升级 Node.js 版本遇到的 co 和 pm2 问题解析
  13. C#Json数据交互
  14. 京东天猫茅台抢购代码的一些总结
  15. PR/AE基础入门操作
  16. matlab神经网络工具箱使用教程
  17. 微信公众号基础04_分享和录音功能的实现
  18. 亚马逊多账号怎么管理|亚马逊账号关联
  19. 团队任务3每日立会(2018-10-23)
  20. 树莓派计算器c语言,树莓派与Python实验9——Tkinter计算器实验

热门文章

  1. 【php】pdo 模糊查询
  2. 逆战班 css表单笔记合集
  3. 小白自学笔记——JAVA基础 2.10嵌套循环
  4. AI大时代——一次全新的生产力革命
  5. 林志玲“女神导航”,高德如何用够明星价值?
  6. IBM X3500 M3升级IMM和UEFI微码
  7. 基于Visual C++2010 与office2010开发办公自动化(23)- 使用剪贴板导出Excel文件
  8. HTML知识点总结之div、section标签
  9. python搞笑语句_一行价值100万美元的代码,可以用来实现搞笑有趣的人工智能对话...
  10. linux cuda 黑屏,Ubuntu下安装Nvidia显卡驱动和Cuda之后黑屏,蓝屏,发生各种错误