montreal英文音素级别强制对齐
之前测试了aeneas的强制对齐,现在再使用Montreal Force Align完成强制对齐任务
首先是Montreal Force Align的安装,直接下载即可
github.com/MontrealCorpusTools/Montreal-Forced-Aligner/releases/download/v1.1.0-beta.2/montreal-forced-aligner_win64.zip"
下载之后文件夹里会有bin和pretrained_models两个文件夹,然后我们cd到montreal-forced-aligner,执行bin/mfa_align和bin/mfa_train_and_align两条命令,如果会显示他们的用法代表我们安装成功
然后就是我们的数据准备阶段,我们每一个语音都需要准备两个文件,一个是该条语音文件(这里值的注意的是我们的语音文件最好是wav格式,采样16000),另一个是该条语音的label,label就是该条语音的内容是什么:举例:he is a good man,用空格隔开即可,文件后缀是./lab或./txt
因为我们要把单词转化为音素,根据文档中写的,我们还需要一个词典http://mlmlab.org/mfa/dictionaries/english.dict,我们可以直接把这个网站链接另存为到我们文件夹中,
随后我们就可以执行bin/mfa_align corpus_directory dictionary acoustic_model output_directory
这里是四个参数
corpus_directory:包含我们的语音文件和文本的文件夹
dictionary:我们刚刚下载的字典
acoustic_model:声学模型,pretrained中的english.zip(注意这个文件不能解压)
output_directory:输出目录文件夹
然后我们就以得到输出结果以textgrid结尾的分割结果
如果需要其他语言任务的对齐可以参考以下几篇文档
g2p模型和预训练模型和词典
https://montreal-forced-aligner.readthedocs.io/en/latest/pretrained_models.html#pretrained-g2p-models
一个使用说明文档
https://www.eleanorchodroff.com/tutorial/montreal-forced-aligner.html#overview-1
montreal英文音素级别强制对齐相关推荐
- python输出文本对齐_speech-aligner,是一个从“人声语音”及其“语言文本”,产生音素级别时间对齐标注的工具...
speech-aligner Chinese readme: speech-aligner,是一个从"人声语音"及其"语言文本",产生音素级别时间对齐标注的工具 ...
- 语音识别中强制对齐_语音识别中的标注问题和嵌入式训练
什么是嵌入式训练(Embedded Training)? 序列的标注问题 机器学习的问题主要分为三类:分类问题,标注问题和回归问题 标注问题的输入是一个观测序列,输出是一个标记序列或者状态序列.标注问 ...
- 宾西法尼亚大学强制对齐标注软件(P2FA)介绍以及使用说明
一.综述 1. 介绍 宾夕法尼亚大学语音标签强制对齐(Penn Phonetics Lab Forced Aligner , P2FA) 是基于 HTK 的自动语音标注工具包.它包括美式英语的声学模型 ...
- aeneas 实现音频强制对齐
做英语学习类产品经常会遇到读句子的时候针对单个单词的类卡拉ok的高亮效果. 这里记录一下音频进度和单词的一一对应关系(类似于歌词文件,粒度为单词级别)如何生成.纯人工来校对的话人工成本还是比较大的. ...
- 语音识别中强制对齐_一种在线语音文本对齐系统及方法
专利名称:一种在线语音文本对齐系统及方法 技术领域: 本发明涉及电视字幕显示领域,特别涉及一种在线语音文本对齐系统及方法. 背景技术: 一个国家电视字幕节目的比例,反应了一个国家的人文水平,反应了社会 ...
- MFA强制对齐音频和音素的用法
目录 环境 准备工作 音素对齐 环境 ubuntu 18.04.4 LTS 准备工作 下载Linux版本的MFA库montreal-forced-aligner_linux.tar.gz(这里下的版本 ...
- IAR中使用struct强制对齐时的一个问题及解决
最近在用IAR开发MSP430程序过程中发现了一个问题,具体描述是这样的 首先定义了一个struct并强制1个字节对齐 #pragma pack(push) //保存对齐状态 #pragma pack ...
- c语言字节强制对齐,C语言的那些小秘密之字节对齐
为了让读者加深印象,我们这里在代码中没有使用0,而是使用的4,所以在最终计算出的结果部分减去了一个4才是偏移地址,当然实际使用中我们都是用的是0. 懂了上面的宏offsetof之后我们再来看看下面的代 ...
- php强制对齐,[强迫症福利] 使用 PHPStorm 对齐数组的键值对
用 php-cs-fixer 自动格式化,一个配置配合 Git 自动格式化,补充楼上. 示例 Git Hook 忽略前端的代码格式化,修改一下就可以用. #!/bin/bash # # check P ...
最新文章
- 将Facebook整个托管在AWS上,这可行吗?
- Perl/CGI脚本语言编程学习资料及开发工具下载大全
- MySQL高级 - 常用工具 - mysql
- 使用C++访问OPC Server的简单方法
- DataTable转成List集合
- 折线 没有显示_动画折线图,你还可以试试这个图表
- C语言关系运算符介绍和示例
- 用RT Server Customizer定制Windows 2008 R2安装光盘
- 深度学习图像分类(二):AlexNet
- GAMMA初学笔记二
- 3dMax 导出材质球
- 海马玩关联android,Android ADB连接海马玩模拟器
- 如何在esxi环境安装硬件VIB驱动。
- Spring5框架day01之IOC容器
- 云商之softlayer与saltstack
- 我和Double Lift的故事(五)——升华篇​
- 计算机那种专业包括vr,VR专业主要学什么
- Hive系列之HSQL转换成MapReduce过程
- 不用学Python的自动化办公 确定不来看看?
- 游戏大版本更新和热更新