目录

  • 环境
  • 准备工作
  • 音素对齐

环境

ubuntu 18.04.4 LTS

准备工作

  1. 下载Linux版本的MFA库montreal-forced-aligner_linux.tar.gz(这里下的版本是Version 1.1.0 Beta 2)
  2. 下载汉语预训练的声学模型(mandarin.zip)
  3. 下载发音词典mandarin-for-montreal-forced-aligner-pre-trained-model.lexicon
  4. 存放数据的data文件夹有(.wav)音频文件和(.lab)正交注解文件,其中(.lab)文件内容如下所示:

lv4 shi4 yang2 chun1 yan1 jing3 da4 kuai4 wen2 zhang1 de5 di3 se4 si4 yue4 de5 lin2 luan2 geng4 shi4 lv4 de5 xian1 huo2 xiu4 mei4 shi1 yi4 ang4 ran2

音素对齐

  1. 解压montreal-forced-aligner_linux.tar.gz
tar zxvf montreal-forced-aligner_linux.tar.gz
  1. 把mandarin.zip放在montreal-forced-aligner/pretrained_models目录,把data文件和mandarin-for-montreal-forced-aligner-pre-trained-model.lexicon发音词典放在montreal-forced-aligner目录。
  2. 终端进入montreal-forced-aligner目录执行mfa_align脚本
./bin/mfa_align data mandarin-for-montreal-forced-aligner-pre-trained-model.lexicon pretrained_models/mandarin.zip result
  1. result目录下生成(.TextGrid)对齐文本
File type = "ooTextFile"Object class = "TextGrid"xmin = 0.0xmax = 9.8125tiers? <exists>size = 2item []:item [1]:      class = "IntervalTier"name = "words"xmin = 0.0xmax = 9.8125     intervals: size = 37intervals [1]:xmin = 0.0xmax = 0.840text = ""intervals [2]:xmin = 0.840xmax = 1.170text = "lv4"intervals [3]:xmin = 1.170xmax = 1.330text = "shi4"intervals [4]:xmin = 1.330xmax = 1.610text = "yang2"intervals [5]:xmin = 1.610xmax = 1.910text = "chun1"......intervals [37]:xmin = 8.920xmax = 9.8125text = ""item [2]:class = "IntervalTier"name = "phones"xmin = 0.0xmax = 9.8125intervals: size = 74intervals [1]:xmin = 0.000xmax = 0.840text = "sil"intervals [2]:xmin = 0.840xmax = 0.960text = "l"intervals [3]:xmin = 0.960xmax = 1.170text = "v4"intervals [4]:xmin = 1.170xmax = 1.290text = "sh"              intervals [5]:xmin = 1.290xmax = 1.330text = "ii4"......           intervals [74]:xmin = 9.790xmax = 9.8125text = ""

MFA强制对齐音频和音素的用法相关推荐

  1. montreal英文音素级别强制对齐

    之前测试了aeneas的强制对齐,现在再使用Montreal Force Align完成强制对齐任务 首先是Montreal Force Align的安装,直接下载即可 github.com/Mont ...

  2. aeneas 实现音频强制对齐

    做英语学习类产品经常会遇到读句子的时候针对单个单词的类卡拉ok的高亮效果. 这里记录一下音频进度和单词的一一对应关系(类似于歌词文件,粒度为单词级别)如何生成.纯人工来校对的话人工成本还是比较大的. ...

  3. 语音识别中强制对齐_语音识别中的标注问题和嵌入式训练

    什么是嵌入式训练(Embedded Training)? 序列的标注问题 机器学习的问题主要分为三类:分类问题,标注问题和回归问题 标注问题的输入是一个观测序列,输出是一个标记序列或者状态序列.标注问 ...

  4. 宾西法尼亚大学强制对齐标注软件(P2FA)介绍以及使用说明

    一.综述 1. 介绍 宾夕法尼亚大学语音标签强制对齐(Penn Phonetics Lab Forced Aligner , P2FA) 是基于 HTK 的自动语音标注工具包.它包括美式英语的声学模型 ...

  5. 语音识别中强制对齐_一种在线语音文本对齐系统及方法

    专利名称:一种在线语音文本对齐系统及方法 技术领域: 本发明涉及电视字幕显示领域,特别涉及一种在线语音文本对齐系统及方法. 背景技术: 一个国家电视字幕节目的比例,反应了一个国家的人文水平,反应了社会 ...

  6. Android音频管理器AudioManager用法

    当我们在听歌时,当我们在刷小视频时,当我们在看动漫.在看电影.在追剧时,不知道是否有人注意到,在这些软件中滑动屏幕或者拖动滑动条就可以直接控制音量,而不需要去按手机硬件上的音量键. 在某些时候,程序需 ...

  7. IAR中使用struct强制对齐时的一个问题及解决

    最近在用IAR开发MSP430程序过程中发现了一个问题,具体描述是这样的 首先定义了一个struct并强制1个字节对齐 #pragma pack(push) //保存对齐状态 #pragma pack ...

  8. c语言字节强制对齐,C语言的那些小秘密之字节对齐

    为了让读者加深印象,我们这里在代码中没有使用0,而是使用的4,所以在最终计算出的结果部分减去了一个4才是偏移地址,当然实际使用中我们都是用的是0. 懂了上面的宏offsetof之后我们再来看看下面的代 ...

  9. php强制对齐,[强迫症福利] 使用 PHPStorm 对齐数组的键值对

    用 php-cs-fixer 自动格式化,一个配置配合 Git 自动格式化,补充楼上. 示例 Git Hook 忽略前端的代码格式化,修改一下就可以用. #!/bin/bash # # check P ...

最新文章

  1. android虚线边框_Android实现代码画虚线边框背景效果
  2. ZOJ Monthly, November 2012
  3. 博客堂怎么连个搜索功能都没有
  4. js在一个指定元素前添加内容_WebAR开发指南(1)---使用AR.js实现第一个WebAR demo...
  5. KVO 实现两个页面之间的通信
  6. 中移4G模块-ML302-OpenCpu开发-(MQTT连接阿里云-RRPC通讯)
  7. cv2.error: opencv(4.4.0)_【从零学习OpenCV 4】图像金字塔
  8. html轮播图水平传送带,经典的白富美型jQuery图片轮播插件
  9. 计算机软件测试方法的分析,计算机软件测试方法的分析.doc
  10. php微信授权登录sdk,微信授权登录如何使用?总结微信授权登录实例用法
  11. Cherry键盘外接Mac command按键失灵
  12. 初学python------写一个心理测试
  13. 解决VMware虚拟机安装ikuai限速10M
  14. 入侵防御系统 IPS
  15. 计算机系统处理机,处理机
  16. 运筹说 第57期 | 整数规划的分支定界法
  17. Android学习——5个UI界面设计
  18. git status的用法
  19. 计算机中64位和32位什么意思?有什么区别?
  20. 《Matrix capsules with EM Routing》新胶囊网络

热门文章

  1. vmware虚拟机添加虚拟磁盘的方法
  2. smmu 学习笔记之mmap函数.
  3. 用Redis和MyBatis完成缓存数据的增加、删除、修改、查询
  4. 只需一个技巧,短视频就可以一键在多个平台同时发布!
  5. Autoit 知识要点
  6. LibQQt系列之十五《QQtDictionary - 什么场合使用字典类别?》
  7. Jquery弹出层插件Thickbox使用心得
  8. 传统价值评估的4种方法(转)
  9. 中国一重集中采购平台的建设经历和亮点
  10. 面临恶意负面舆情,企业应该怎么应对和处理?