Tacotron2(NVIDIA版)中文训练笔记

Tacotron2项目地址:https://github.com/NVIDIA/tacotron2

Tacotron2英文训练笔记:https://blog.csdn.net/qq_44951010/article/details/124828260

从科大讯飞爬取音频数据:https://blog.csdn.net/qq_44951010/article/details/124829630

步骤

  1. 下载项目或通过git clone https://github.com/NVIDIA/tacotron2.git拉取项目

  2. 准备数据,可以用开源的中文数据集,也可以自己制造,自己制造过程如下:

    • 准备中文文本(我直接提取了标贝数据集的中文),放在一个txt文件中,格式如下:

      卡尔普陪外孙玩滑梯
      假语村言别再拥抱我
      宝马配挂跛骡鞍貂蝉怨枕董翁榻
      邓小平与撒切尔会晤
      老虎幼崽与宠物犬玩耍
      身长约五尺二寸五分或以上
      ...
      
    • 通过爬虫从科大讯飞爬取文本对应的音频,详见从科大讯飞爬取音频数据

    • 将音频转换为.wav格式,需要安装ffmpeg并添加到环境变量,代码参考:

      # -*- coding: utf-8 -*-
      from ffmpy import FFmpeg as mpy
      import osdef trans(mp3_file, wav_folder):# 创建 wav 文件路径wav_file = os.path.join(wav_folder)wav_file = os.path.join(wav_file, '{}.wav'.format(os.path.basename(mp3_file).strip().split('.')[0]))# 创建转换时的命令行参数字符串cmder = '-f wav -ac 1 -ar 16000'# 创建转换器对象mpy_obj = mpy(inputs = {mp3_file: None},outputs = {wav_file: cmder})print('执行cmder命令: {}'.format(mpy_obj.cmd))# 执行转换mpy_obj.run()def mp3_to_wav(mp3_folder, wav_folder):for mp3_file in os.listdir(mp3_folder):mp3_file = os.path.join(mp3_folder, mp3_file)trans(mp3_file, wav_folder)if __name__ == '__main__':mp3_to_wav('mp3文件夹', 'wav文件夹')
      
    • 通过lazy_pinyin模块生成中文文本对应的拼音,代码示例:

      from pypinyin import lazy_pinyin, Styletext = "我好菜啊"
      text = " ".join(lazy_pinyin(text, style=Style.TONE3))
      print(text)
      
  3. 得到中文文本的应的音频和拼音后,建它们的关系,即需要生成filelists目录下的三个文件,格式如下:

  4. 打开hparams.py文件,将samling_rate(采样率)改为16000,然后就可以开始训练了

Tacotron2中文训练笔记相关推荐

  1. Tacotron2训练笔记

    Tacotron2(NVIDIA版)训练笔记 Tacotron2项目地址:https://github.com/NVIDIA/tacotron2 Tacotron2中文训练笔记:https://blo ...

  2. 可由一个尾指针唯一确定的链表有_极客算法训练笔记(三),链表详细图解,别再逃避了朋友...

    目录 缓存引爆链表 链表单链表双向链表循环链表双向循环链表 LinkedHashMap实现LRU缓存,源码解析(JDK1.8) 算法 爬楼梯 算法 反转链表 算法 链表环检测 缓存引爆链表 存储结构 ...

  3. 严蔚敏算法约瑟夫环_极客算法训练笔记(三),链表详细图解,别再逃避了朋友...

    目录 缓存引爆链表 链表 单链表 双向链表 循环链表 双向循环链表 LinkedHashMap实现LRU缓存,源码解析(JDK1.8) 算法 爬楼梯 算法 反转链表 算法 链表环检测 缓存引爆链表 存 ...

  4. 极客算法训练笔记(六),十大经典排序之希尔排序,快速排序

    目录 抛砖引玉 希尔排序 快速排序 抛砖引玉 十大经典排序算法江山图 十大经典排序算法江山图 排序算法的衡量指标我这里不再重复,上一篇我已经列举分析的很清楚了,但是非常重要,没看到我上一篇的小伙伴墙裂 ...

  5. Yoshua Bengio新书《Deep Learning》深度学习(中文)学习笔记(improving)

    Yoshua Bengio新书<Deep Learning>深度学习(中文)学习笔记: http://download.csdn.net/detail/forest_world/97057 ...

  6. [ZT]640-801中文读书笔记

    [原创]640-801中文读书笔记 作者:红头发 03-22-2004                               打包下载 Noko#sh run ! Written by 红头发 ...

  7. 计算机网络 自顶向下方法 第七版中文 读书笔记 目录

    计算机网络 自顶向下方法 第七版中文 读书笔记 目录 计算机网络 自顶向下方法 第七版中文 读书笔记 目录 第 1 章 计算机网络和因特网 第 2 章 应用层 第 3 章 运输层 第 4 章 网络层 ...

  8. 李宏毅机器学习完整笔记发布,AI界「最热视频博主」中文课程笔记全开源

    点上方"小詹学Python",选择"置顶公众号"第一时间获取干货分享!本文转自:Datawhale 提起李宏毅老师,熟悉机器学习的读者朋友一定不会陌生.很多人选 ...

  9. python ocr中文训练_cnocr: cnocr是用来做中文OCR的Python 3包。cnocr自带了训练好的识别模型,安装后即可直接使用...

    English README. cnocr 使用交流QQ群 欢迎扫码加入QQ交流群: 最近更新 [2020.05.29]:V1.2.2 主要变更: 优化了对数字识别的准确度. 优化了模型结构,进一步降 ...

最新文章

  1. matlab system object,通过 System object 实现模块
  2. VS2015使用小技巧
  3. repeater 时间格式化
  4. 用ul li实现边框重合并附带鼠标经过效果
  5. Superset单点登录调整源码
  6. windows绕开强制更新
  7. Python的pip下载特定版本TensorFlow方法
  8. phoenixframe自动化测试平台对Firefox和chrome支持的说明
  9. 参数利用SpringMVC构建REST接口:第七篇 控制层实现
  10. kali-网站克隆工具-httrack
  11. 经典python题目练习
  12. MATLAB线性规划整数变量,Matlab 整数线性规划问题模型代码
  13. SSRF漏洞原理及检测
  14. 288388D-EnterCAT调试
  15. 记一次对钓鱼邮件的分析
  16. 【系统运维-Linux】使用U盘安装Linux
  17. Java/web/jsp根据pdf模板生成荣誉证书PDF文件
  18. 用ECS做HexMap:鼠标点击六边形单元涂色
  19. nginx常用配置笔记
  20. 复制知乎专栏文章的方法

热门文章

  1. 宣传计算机知识竞赛的说说,知识竞赛的宣传标语
  2. CSSStyleDeclaration 上不存在属性、cssText
  3. php 负数装正,负数转正数_php怎么把负数转正数
  4. 3.进制——进制转换和计算机存储单位
  5. QQ玩一玩最新调试方法
  6. es 定时备份 删除 与数据恢复
  7. 信息学奥赛初赛CSP-J1 CSP-S1 第1轮如何获得满意的 理想的成绩
  8. jupyternotebook 报告_Jupyter Notebook 环境使用指南
  9. 塔塔帝国服务器维护一般多久,塔塔帝国玩法攻略 策略性一般不氪金的塔防游戏...
  10. u盘变o字节怎么修复_U盘容量突然变成了0字节怎么办?