之前测试了aeneas的强制对齐,现在再使用Montreal Force Align完成强制对齐任务

首先是Montreal Force Align的安装,直接下载即可

github.com/MontrealCorpusTools/Montreal-Forced-Aligner/releases/download/v1.1.0-beta.2/montreal-forced-aligner_win64.zip"

下载之后文件夹里会有bin和pretrained_models两个文件夹,然后我们cd到montreal-forced-aligner,执行bin/mfa_align和bin/mfa_train_and_align两条命令,如果会显示他们的用法代表我们安装成功

然后就是我们的数据准备阶段,我们每一个语音都需要准备两个文件,一个是该条语音文件(这里值的注意的是我们的语音文件最好是wav格式,采样16000),另一个是该条语音的label,label就是该条语音的内容是什么:举例:he is a good man,用空格隔开即可,文件后缀是./lab或./txt

因为我们要把单词转化为音素,根据文档中写的,我们还需要一个词典http://mlmlab.org/mfa/dictionaries/english.dict,我们可以直接把这个网站链接另存为到我们文件夹中,
随后我们就可以执行bin/mfa_align corpus_directory dictionary acoustic_model output_directory
这里是四个参数

corpus_directory:包含我们的语音文件和文本的文件夹
dictionary:我们刚刚下载的字典
acoustic_model:声学模型,pretrained中的english.zip(注意这个文件不能解压)
output_directory:输出目录文件夹

然后我们就以得到输出结果以textgrid结尾的分割结果

如果需要其他语言任务的对齐可以参考以下几篇文档

g2p模型和预训练模型和词典

https://montreal-forced-aligner.readthedocs.io/en/latest/pretrained_models.html#pretrained-g2p-models

一个使用说明文档

https://www.eleanorchodroff.com/tutorial/montreal-forced-aligner.html#overview-1

montreal英文音素级别强制对齐相关推荐

  1. python输出文本对齐_speech-aligner,是一个从“人声语音”及其“语言文本”,产生音素级别时间对齐标注的工具...

    speech-aligner Chinese readme: speech-aligner,是一个从"人声语音"及其"语言文本",产生音素级别时间对齐标注的工具 ...

  2. 语音识别中强制对齐_语音识别中的标注问题和嵌入式训练

    什么是嵌入式训练(Embedded Training)? 序列的标注问题 机器学习的问题主要分为三类:分类问题,标注问题和回归问题 标注问题的输入是一个观测序列,输出是一个标记序列或者状态序列.标注问 ...

  3. 宾西法尼亚大学强制对齐标注软件(P2FA)介绍以及使用说明

    一.综述 1. 介绍 宾夕法尼亚大学语音标签强制对齐(Penn Phonetics Lab Forced Aligner , P2FA) 是基于 HTK 的自动语音标注工具包.它包括美式英语的声学模型 ...

  4. aeneas 实现音频强制对齐

    做英语学习类产品经常会遇到读句子的时候针对单个单词的类卡拉ok的高亮效果. 这里记录一下音频进度和单词的一一对应关系(类似于歌词文件,粒度为单词级别)如何生成.纯人工来校对的话人工成本还是比较大的. ...

  5. 语音识别中强制对齐_一种在线语音文本对齐系统及方法

    专利名称:一种在线语音文本对齐系统及方法 技术领域: 本发明涉及电视字幕显示领域,特别涉及一种在线语音文本对齐系统及方法. 背景技术: 一个国家电视字幕节目的比例,反应了一个国家的人文水平,反应了社会 ...

  6. MFA强制对齐音频和音素的用法

    目录 环境 准备工作 音素对齐 环境 ubuntu 18.04.4 LTS 准备工作 下载Linux版本的MFA库montreal-forced-aligner_linux.tar.gz(这里下的版本 ...

  7. IAR中使用struct强制对齐时的一个问题及解决

    最近在用IAR开发MSP430程序过程中发现了一个问题,具体描述是这样的 首先定义了一个struct并强制1个字节对齐 #pragma pack(push) //保存对齐状态 #pragma pack ...

  8. c语言字节强制对齐,C语言的那些小秘密之字节对齐

    为了让读者加深印象,我们这里在代码中没有使用0,而是使用的4,所以在最终计算出的结果部分减去了一个4才是偏移地址,当然实际使用中我们都是用的是0. 懂了上面的宏offsetof之后我们再来看看下面的代 ...

  9. php强制对齐,[强迫症福利] 使用 PHPStorm 对齐数组的键值对

    用 php-cs-fixer 自动格式化,一个配置配合 Git 自动格式化,补充楼上. 示例 Git Hook 忽略前端的代码格式化,修改一下就可以用. #!/bin/bash # # check P ...

最新文章

  1. 将Facebook整个托管在AWS上,这可行吗?
  2. Perl/CGI脚本语言编程学习资料及开发工具下载大全
  3. MySQL高级 - 常用工具 - mysql
  4. 使用C++访问OPC Server的简单方法
  5. DataTable转成List集合
  6. 折线 没有显示_动画折线图,你还可以试试这个图表
  7. C语言关系运算符介绍和示例
  8. 用RT Server Customizer定制Windows 2008 R2安装光盘
  9. 深度学习图像分类(二):AlexNet
  10. GAMMA初学笔记二
  11. 3dMax 导出材质球
  12. 海马玩关联android,Android ADB连接海马玩模拟器
  13. 如何在esxi环境安装硬件VIB驱动。
  14. Spring5框架day01之IOC容器
  15. 云商之softlayer与saltstack
  16. 我和Double Lift的故事(五)——升华篇​
  17. 计算机那种专业包括vr,VR专业主要学什么
  18. Hive系列之HSQL转换成MapReduce过程
  19. 不用学Python的自动化办公 确定不来看看?
  20. 游戏大版本更新和热更新

热门文章

  1. 高效演讲-读书笔记-樊登读书
  2. 迪文串口屏的CFG文件怎么用?
  3. 什么是驱动模块?什么是桩模块?
  4. java javac 区别
  5. AutoIT的下载与安装
  6. 在gitcafe上部署hexo博客方法介绍
  7. ap计算机笔记,重磅!AP确定线上开卷考,公开喊话赶紧做笔记!
  8. 自己封装的环信接口,包括授权注册、创建聊天室、添加成员、发送信息等
  9. A Two-Stage Unsupervised Approach for Low Light Image Enhancement 论文阅读笔记
  10. 【linux】记录一次crontab定时任务+ lsof 无法正常执行的问题