老许小课堂开课了

一、转语音工具

  微信读书里的电子书有配套的自动音频,而且声音优化的不错,比传统的机械朗读听起来舒服很多。

  记得之前看到过Python有一个工具包,可以将文字转换为语音,支持英文和中文,而且能调节语速语调、导出mp3等。

  去Github查了下,这个库叫:pyttsx3

  简单来说,pyttsx3可以文字转语音,且是离线工作的,这一点就很实用。

  安装比较容易,直接在命令行用pip安装:

  我准备动手试试,将PDF书籍转成音频。

  用什么书呢?最近在群里看到有人发张磊的新作《价值》电子书,这本今年刚出的畅销书盗版猖獗,我之前在微信读书里看过,对作者长期主义的观点深信不疑。

二、PDF转文本

  既然是把PDF转化成语音,肯定是需要先读取PDF中的文字,再利用pyttsx3转语音。

  Python中操作PDF的工具库主要是PyPDF2,但发现编码实在有点繁琐,我就换了另一个库pdfplumber,与PyPDF2语法类似,用起来还算流畅。

  pdfplumber可以处理PDF包括文本、表格、格式在内的各种信息,小而强大。

  输出:

  上面的代码做了几件事情:「读取PDF文档、读取页数、读取第4页、输出第4页文本」

三、文本转语音

  接下来开始将第4页的文本转化为音频。

  上面代码使用pyttsx3将文本转化为音频,然后朗读出来。我是在jupyter notebook上做实验的,代码执行后,电脑会直接朗读。

  也可以将生成的音频保存为mp3格式。

  当然你还可以调整声音的类型、速度、大小。

最后,欢迎有事没事找老许唠嗑,天南海北各种专业知识咱都懂一点点儿。

如何使用Python将PDF文档转为MP3音频相关推荐

  1. 教你如何使用 Python 将 pdf 文档进行 加密 解密——python实用小技能分享

      上次说了怎么将word转换为pdf格式 及 实现批量将word转换为pdf格式(点击这里),这次我又get到一个新技能–使用 Python 将 pdf 文档进行 加密 解密,哈哈哈 希望帮到更多人 ...

  2. 数据导入与预处理-第4章-数据获取python读取pdf文档

    数据导入与预处理-第4章-数据获取Python读取PDF文档 1 PDF简介 1.1 pdf是什么 2 Python操作PDF 2.1 pdfplumber库 2.2 pdfplumber基本操作 2 ...

  3. Python读取PDF文档(或TXT)

    字符串在Python内部的表示是Unicode编码,首先我们来认识Python中encode()和decode()的作用与区别: 在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的 ...

  4. 【Python】PDF文档导出指定章节为TXT

    PDF文档导出指定章节为TXT 需求 要导出3000多个pdf文档的特定章节内容为txt格式(pdf文字可复制). 解决 导出PDF 查了一下Python操作PDF文档的方法,主要是通过3个库,PyP ...

  5. python 将一段文字转为mp3音频文件

    最近想实现利用python将文本文件转换成mp3--听书,pyttsx3是一款优秀的文字转语音的模块,它生成的音频文件也比较具有个性化. #encoding=utf8''' python将一段文字转为 ...

  6. python书籍pdf文档密码-Python玩转PDF的各种骚操作

    Portable Document Format(可移植文档格式),或者PDF是一种文件格式,可以用于跨操作系统的呈现和文档交换.尽管PDF最初是由Adobe发明的,但它现在是由国际标准化组织(ISO ...

  7. python分割pdf文档

    python -V 3.7 需求 需要将一个pdf文档分割成一页一页的pdf 代码 可以使用PyPDF2库 from PyPDF2 import PdfFileReader, PdfFileWrite ...

  8. python pdf处理工具_用Python处理pdf文档

    介绍 译者翻译了很多Python强大的包,其中,一以贯之的思想是:面向对象.我用下面的翻译来举一个例子,比如:从PyPDF2包中导入PdfFileReader包.PdfFileReader是此包的一个 ...

  9. python搜索pdf内容所在页码_利用Python在pdf文档中寻找某些词出现的页码

    要研究pdf文件的页码,首先要考虑这个文件的种类.pdf可能是一本书的电子版,可能是一份简历.可能是由Word.PPT或其他文档导出的--如果不是一本书,通常页面内容里是没有页码的:如果是一本书,虽然 ...

最新文章

  1. 二维字符数组按长度排序_字符串长度 字符数组长度
  2. User profile synchronization service starting issues 用户配置文件同步服务启动问题
  3. MacOs High Sierra 升级失败解决办法
  4. C语言链表的来源分析
  5. 传统POS/终端/银联POS简介
  6. 蒂法html5游戏,《最终幻想7:重制版》大量新截图:蒂法招式/支线任务
  7. 全面支持3.0 新华三“力夯”可信计算发展
  8. 将三角形绕点b顺时针旋转90度_模型 | 图形旋转与翻折题型汇编
  9. shell编写一键安装mysql.sh
  10. 关于Mysql模糊查询下划线的问题
  11. 涨薪慢,该不该跳槽?
  12. Android USB Audio accessory设备
  13. C++ 工程实践(3):采用有利于版本管理的代码格式
  14. ArcView 9.3 安装帮助指南(针对Student Edition-One-Year版本)
  15. Spring源码下载及安装
  16. Windows下装ubuntu系统
  17. 配置ABP的redis
  18. 阿额企鹅我恶趣味企鹅我去恶趣味
  19. win10老是弹出计算机管理器,win10系统Ie11老是弹出“管理加载项”提示框取消的处理办法...
  20. 图片路径加?什么意思

热门文章

  1. 织梦 PHP和帝国哪个好,织梦CMS(dedecms)和帝国CMS哪个好
  2. 双十一销量猛增 电商平台以外FIIL耳机开辟新路径
  3. android 计数器,android计数器——基础编
  4. 装修需要注意的小细节
  5. SQL的连表查询 详细
  6. RDO部署多节点OpenStack Havana(OVS+GRE)
  7. 7135制作自动量程电压切换_icl7135电路
  8. SolidWorks正版软件系统配置要求
  9. 红帽权限设置及提权知识点结合
  10. 小信号采集的硬件设计方案注意事项及电源问题汇总