知乎第一篇文章,本来想写一篇简单的单进程单线程爬虫教程的,可是知乎上这样的文章已经有很多了,而且写的好的挺多,我就不添堵了。下次有空的话写一篇多线程请求的爬虫教程。

这是一篇简单的Python文字(汉字)转语音教程,当然对于其他语言工具在实现的方法上也是一样的 。

在自然语言处理上,文字、音频互转是一个很关键的技术点。对于语音转文字,这个个人实现较为困难,我们可以使用语音转文字的软件或借助各API(如科大讯飞等)进行移植开发。不过文字转语音就相对而言容易实现很多了。

简言之, 汉字转语音实现就分为两步,第一步将汉字转为拼音,第二步通过拼音调用相匹配的音频文件。下面是具体的开发实例教程。

开发环境:Windows

Python版本:3.x

外置模块准备:pygame(可直接在cmd命令行中pip install pygame安装)

汉字转拼音

我使用的是将汉字转为Unicode码,然后通过查询一个匹配文件(我使用的是unicode_pinyin.txt)获取该汉字的拼音,该文件中列有从4E00-9FA5标准汉字的Unicode编码所对应的拼音,外加一个落单的3007编码的“〇”。

文件如下:

<img src="https://pic3.zhimg.com/v2-aef3bc434445a3bdbef7a80215a51062_b.png" data-rawwidth="577" data-rawheight="533" class="origin_image zh-lightbox-thumb" width="577" data-original="https://pic3.zhimg.com/v2-aef3bc434445a3bdbef7a80215a51062_r.png">

文件链接:http://pan.baidu.com/s/1i51IJUP 密码:fge1
在大写拼音英文后的1,2,3,4,5分别表示一,二,三,四和轻声(注意到存在有多音字)

我们将其封装成一个函数,参数为一个全是汉字的字符串,返回是一个拼音字符串。(即chinese_to_pinyin("秋水共长天一色") 返回的是"QIU1 SHUI3 GONG4 CHANG2 TIAN1 YI1 SE4 ")

源码如下:

def chinese_to_pinyin(x):y = ''dic = {}with open("unicode_pinyin.txt") as f:for i in f.readlines():dic[i.split()[0]] = i.split()[1]for i in x:i = str(i.encode('unicode_escape'))[-5:-1].upper()try:y += dic[i] + ' 'except:y += 'XXXX ' #非法字符我们用XXXX代替return y

说明:将该文件与"unicode_pinyin.txt"文件放在同一目录下,代码比较简陋,因为主要给大家讲实现教学,所以没有对多音字进行处理(所以默认使用第一个使用频率最高的音)

拼音转语音

这一步也比较简单,我们根据拼音调用相对应的单个音的音频文件即可。单个音的音频文件可以自己录或找人录,渠道有很多哦。注意文件格式,最好是mp3或wav文件。

部分文件展示如下:

<img src="https://pic1.zhimg.com/v2-5a2fad316be99db032dd422198172694_b.png" data-rawwidth="134" data-rawheight="323" class="content_image" width="134"> 我们将其置入一个voice文件夹下。准备工作就做好了。 我们将其置入一个voice文件夹下。准备工作就做好了。

我们同样将汉字转语音封装成一个make_voice函数,参数为一个汉字字符串,然后调用chinese_to_pinyin函数,返回值不重要,可为空,功能实现是调用音频文件发音。

源码如下:

import pygame
def make_voice(x):pygame.mixer.init()voi = chinese_to_pinyin(x).split()for i in voi:if i == 'XXXX':  #处理'XXXX'的音,可将其忽略continuepygame.mixer.music.load("voice/" + i + ".mp3")pygame.mixer.music.play()while pygame.mixer.music.get_busy() == True:passreturn None

我们展示一下这个教学版的最后完整的代码图(该文件名为"test.py"):

import pygamedef chinese_to_pinyin(x):y = ''dic = {}with open("unicode_pinyin.txt") as f:for i in f.readlines():dic[i.split()[0]] = i.split()[1]for i in x:i = str(i.encode('unicode_escape'))[-5:-1].upper()try:y += dic[i] + ' 'except:y += 'XXXX 'return ydef make_voice(x):pygame.mixer.init()voi = chinese_to_pinyin(x).split()for i in voi:if i == 'XXXX':continuepygame.mixer.music.load("voice/" + i + ".mp3")pygame.mixer.music.play()while pygame.mixer.music.get_busy() == True:passreturn Nonewhile True:p = input("请输入文字:")make_vioce(p)

教程文件的文件树结构:

test.py
unicode_pinyin.txt
voice----A1.mp3A2.mp3A3.mp3...

实现原理就是这样,同时也可以视一些具体情况做一些拓展,例如将阿拉伯数字转汉字读法(即1234006.15读作“一百二十三万四千零六点一五”,这个实现不难),还有将多音字问题攻破也是很棒的。

当然只要想法够丰富用pygame的音频功能也能实现很多有趣的功能(如播放器制作或电子音乐简单创作等)。

我的表演完了,谢谢大家。如果这篇文章对您有帮助的话,请在收藏的同时一赞支持。光收藏不点赞的你们的良心不会痛吗

Python文字(汉字)转语音https://zhuanlan.zhihu.com/p/26726297相关推荐

  1. 2021-03-16 转自知乎专栏 https://zhuanlan.zhihu.com/p/24482664

    转载https://zhuanlan.zhihu.com/p/24482664 审计是什么 为了弄明白审计是什么,我们要回答的却是什么情况下需要审计. 企业并不是一开始就需要审计,而是是随着自身的发展 ...

  2. [转]局域网共享一键修复 18.5.8 https://zhuanlan.zhihu.com/p/24178142

    @echo off color 2f mode con cols=50 lines=30 title OKShare [制作:wnsdt] ver | findstr "6."&g ...

  3. 红芯浏览器真的“安全”吗? - 杰洛特的文章 - 知乎 https://zhuanlan.zhihu.com/p/42482349

    红芯浏览器真的"安全"吗? - 杰洛特的文章 - 知乎 https://zhuanlan.zhihu.com/p/42482349 红芯浏览器真的"安全"吗? ...

  4. 人脸检测背景介绍写的很好,请看知乎原文,https://zhuanlan.zhihu.com/p/32702868

    知乎原文, https://zhuanlan.zhihu.com/p/32702868 #if 0 写这个系列的动机有两点:(第零是农药双排队友周末经常有事,没人一起玩,)第一,检测和跟踪之间有斩不断 ...

  5. https://zhuanlan.zhihu.com/p/37477575

    https://zhuanlan.zhihu.com/p/37477575 PPT做的好,要饭要到老,所以我都是一个模板走天下! 主要有五个分类,分别是:模板站.设计灵感.配色工具.高清图库.图表,共 ...

  6. JuMP: 用Julia进行优化建模及求解- 覃含章的文章 - 知乎 https://zhuanlan.zhihu.com/p/40807662

    JuMP: 用Julia进行优化建模及求解 - 覃含章的文章 - 知乎 https://zhuanlan.zhihu.com/p/40807662 0. 为什么要用Julia做优化? 本文是我在Jul ...

  7. https://zhuanlan.zhihu.com/p/33841176

    假设我们经过一个Relu之后的输出如下 Relu: 然后开始到达全连接层 啊啊啊,终于开始进入CNN的末尾了 已经推到敌军老家了,准备开始攻打水晶了 大家坚持住,黎明前,最黑暗 以上图为例,我们仔细看 ...

  8. 转自知乎,深度强化学习论文https://zhuanlan.zhihu.com/p/23600620

    一. 开山鼻祖DQN 1. Playing Atari with Deep Reinforcement Learning,V. Mnih et al., NIPS Workshop, 2013. 2. ...

  9. TensorFlow 加载多个模型的方法 - 知乎 https://zhuanlan.zhihu.com/p/53642222

    TensorFlow 加载多个模型的方法 - 知乎 什么是Tensorflow模型? 当你训练好一个神经网络后,你会想保存好你的模型便于以后使用并且用于生产.因此,什么是Tensorflow模型?Te ...

最新文章

  1. Oracle计算时间差表达式
  2. WEB站点使用企业库安全性异常解决办法
  3. 中国LED产业园区现状模式及投资策略分析报告2022-2028年版
  4. delphi中的指针与C类似
  5. unity 全息交互ui_UI向3D投影全息界面的连续发展
  6. MongoDB与其他数据库的对比
  7. 使用JS提交form表单和w3c标准
  8. 一次Web请求返回406原因与解决方案
  9. flask (三) 重定向
  10. 身份证归属地查询免费api接口代码
  11. Java对文件/文件夹进行压缩或解压缩
  12. PS:如何使用PS制作好看的文字图片,以CSDN分类专栏图标为例
  13. 使用 Django 实现私有云盘
  14. php屏蔽微信网页投诉按钮,屏蔽微信(QQ)内置浏览器菜单中的投诉按钮
  15. Flash ANE打包
  16. 第1讲 样本空间 随机事件
  17. 文本框输入关键字提示
  18. 顶会 INFOCOM 巴黎进行时,最高荣誉花落微软老将
  19. win10计算机管理器在哪,Win10设备管理器在哪里?Win10系统设备管理器打开方法图解...
  20. 【005】VS直连Github以及Gitee

热门文章

  1. 魔都记----在美团工作
  2. 免费的证件照在线制作工具
  3. USB Server应用于网银U盾
  4. 蒙特卡罗树搜索之初学者指南
  5. numpy嵌套序列数量不一样怎么样
  6. 设计模式——共享模式
  7. 14个上级与下属进行绩效面谈时的主题(四)
  8. python爬取英雄联盟手游的全英雄皮肤 初识selenium
  9. 《如何写好科研论文》《学术规范与论文写作》-长江雨课堂-2022秋季期末考试答案分享
  10. 国内科技公司不爱收购爱挖人?探索中外“贫富差距”背后的原因