如何下载并使用HTK工具包
HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做The HiddenMarkov Toolkit。官方网站:http://htk.eng.cam.ac.uk
这个工具包必须安装VS后才能使用。因为它是基于C进行开发的。HTK工具包的安装需要配置一个VS的环境变量。值得一提的是,我们现在能安装的VS版本中的环境变量路径与HTK工具包中提示的路径大不一样了。像本人安装的VS2017版本的所使用的环境变量为 D:\Microsoft Visual Studio\2017\Community\VC\Auxiliary\Build。
HTK工具包的安装需要在官网注册后才能下载。解压后,根据HTK自带的README,大家可以按照步骤自行安装。(注:需要在htk文件下的cmd窗口进行操作)
HTK工具包主要有以下几个功能:
HSLab.exe 录音,标记工具
Hcopy.exe 从语音提取特征参数的工具
HInit.exe 和 HCompV.exe 对HMM模型初始化的工具,注意,这里需要对每个模型都要使用此命令进行初始化
HRest.exe 对模型进行迭代训练的工具
HParse.exe 语法转网络的工具,发音转本文用到的。
HSGen.exe 语法查错工具
HVite.exe 解码工具,也就是识别工具。可以用命令行方式使用,也可以用交互方式使用。
当安装完成后,该如何使用这个工具包呢?笔者以接下来的实验中所用到的提取MFCC特征举例。首先需要新建一个文件夹,然后在复制Hcopy.exe到该文件下,然后需要配置两个文件list.scp和tr_wav.cfg。整体框架如下:
list.scp文件中写入待提取的WAV文件名与提取MFCC特征后的,mfc文件名。
tr_wav.cfg文件存入提取MFCC特征的参数。
#[MODULE] PARAMETER = VALUE
SOURCEKIND = WAVEFORM
SOURCEFORMAT = WAV
ZMEANSOURCE = F #
TARGETKIND = MFCC_E_D_A_Z
TARGETRATE = 100000.0 # frame period = 10msec
SAVECOMPRESSSED = T
SAVEWITHCRC = T
WINDOWSIZE = 250000.0 # window size = 25msec
USEHAMMING = T
PREEMCOEF = 0.97 # 1st order preemphasis, coefficient = 0.97
NUMCHANS = 26 # num. of filterbank channel = 26
CEPLIFTER = 22 # num. of cepstra = 22
NUMCEPS = 12 # num. of MFCC coefficient = 12
ENORMALIZE = T # energy normalization (live: F, otherwise: T)
ALLOWXWRDEXP = T # Needed for cross word systems
FORCECXTEXP = T # Needed for cross word systems
#HSHELL Parameters
HSHELL: TRACE = 0002 # cotal
#HPARM Parameters
HPARM: TRACE = 0101
#HLABEL Parameters
HLABEL: TRACE = 0010
#HNET Parameters
HNET: TRACE = 0001 # Needed for recognition
#HREc Parameters
HREC: FORCEOUT = T
在这个文件夹下打开cmd,运行 hcopy -A -D -T 1 -C tr_wav.cfg -S .\list.scp ,即可提取出所需要.mfc文件。
成功的标志如下图所示:
参考博客:
1.https://blog.csdn.net/qq_36444303/article/details/100164507?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control
2.https://blog.csdn.net/jojozhangju/article/details/18714961
如何下载并使用HTK工具包相关推荐
- 下载centos下的工具包
http://mirrors.163.com/centos/7/os/x86_64/Packages/ 下载centos下的工具包
- 基于htk工具包的语音识别
htk简介: HTK是一个构建隐藏马尔可夫模型(HMMs)的工具包.HMMs可以用于任何时间序列的建模建模,HTK的核心就是类似的通用目的.然而,HTK主要设计用于构建基于HMM的语音处理工具,特别是 ...
- java微信附件下载_WxJava微信开发工具包
下面我们对WxJava微信开发工具包文件阐述相关使用资料和WxJava微信开发工具包文件的更新信息. WxJava微信开发工具包 WxJava微信开发Java开发工具包(SDK),支持包括微信支付.微 ...
- HTK语音识别工具包的安装和编译
今天介绍一下HTK语音识别工具包的安装和编译,希望能够帮助到更多做语音相关工作的同仁们. 介绍: HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做H ...
- ADB 驱动以及工具包下载安装,常见异常问题解决(亲自测试有效)1、黄色感叹号2、offline 3、unauthorized
操作系统 win32位 首先下载驱动包和工具包(做个任务赚下C币,很快的) http://download.csdn.net/download/u012611644/10253370 解压后两个文件 ...
- Windows下搭建HTK
转自:http://blog.csdn.net/yanli0823/article/details/8186382 亲测有效,环境: windows 8.1 perl版本: HTK版本:Hidden ...
- python调用htk工具箱_HTK学习笔记(一)在win32(win7)下安装HTK详细体验教程
实验室有语音识别的部分,所以在离开雁栖湖之前希望自己可以掌握一些HTK语音工具的流程及知识,以便回到实验室之后会的多一点,不至于大脑一片空白 想学HTK已经有很长一段时间了,有同学建议先把 <H ...
- Raspberry Pi 4B安装 OpenVINO™ 工具包
OpenVINO™ 下载树莓派使用的 OpenVINO™ 工具包 创建安装文件夹 安装外部软件依赖项 设置环境变量 为英特尔神经计算棒 2 设备添加 USB 规则 构建并运行对象检测示例 查看树莓派有 ...
- BeanUtils工具包操作JavaBean
我们在操作JavaBean的时候 我们可以用Introspector的方式来操作,但是呢这样需要我们写大量的代码 . Apache小组为我们提供了很有用的工具包来操作JavaBean 也就是Be ...
最新文章
- centos7上搭建http服务器以及设置目录访问
- POJ1358 Agri-Net
- 2021 最流行的十大项目,新项目居榜首,总有长江后浪推前浪!
- mysql innodb redolog_Mysql的binlog 和InnoDB的redo-log
- iBATIS存储过程
- python将字典作为参数传入函数
- python | 实现多行向量(matrix)两两计算余弦距离、欧几里德距离
- Bailian2700 字符替换【字符串】
- Python3.6读写串口操作
- protues 仿真 12864转OLED接法
- ipad浏览器安装java_360浏览器苹果平板下载
- java 自动填充,使用java自动填充,实现mysql的创建修改时间的自动填充
- 随笔之大学四年生活有感
- css多媒体竖屏,css3 媒体查询方向:横屏竖屏教程
- C++20新特性全在这一张图里了
- div 自定义拉宽_纯Css实现Div高度根据自适应宽度(百分比)调整
- Regin恶意软件:何以潜伏如此久?
- JavaFX源码分析实战:如何设置窗体标题小图标和任务栏图标
- 输入命题p和q的真值,求p、q的合取、析取、异或、蕴含和等值命题的真值
- Win7环境下搭建Android安卓开发环境