HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做The HiddenMarkov Toolkit。官方网站:http://htk.eng.cam.ac.uk

这个工具包必须安装VS后才能使用。因为它是基于C进行开发的。HTK工具包的安装需要配置一个VS的环境变量。值得一提的是,我们现在能安装的VS版本中的环境变量路径与HTK工具包中提示的路径大不一样了。像本人安装的VS2017版本的所使用的环境变量为 D:\Microsoft Visual Studio\2017\Community\VC\Auxiliary\Build。

HTK工具包的安装需要在官网注册后才能下载。解压后,根据HTK自带的README,大家可以按照步骤自行安装。(注:需要在htk文件下的cmd窗口进行操作)

HTK工具包主要有以下几个功能:

HSLab.exe     录音,标记工具

Hcopy.exe     从语音提取特征参数的工具

HInit.exe 和 HCompV.exe 对HMM模型初始化的工具,注意,这里需要对每个模型都要使用此命令进行初始化

HRest.exe     对模型进行迭代训练的工具

HParse.exe    语法转网络的工具,发音转本文用到的。

HSGen.exe    语法查错工具

HVite.exe      解码工具,也就是识别工具。可以用命令行方式使用,也可以用交互方式使用。

当安装完成后,该如何使用这个工具包呢?笔者以接下来的实验中所用到的提取MFCC特征举例。首先需要新建一个文件夹,然后在复制Hcopy.exe到该文件下,然后需要配置两个文件list.scp和tr_wav.cfg。整体框架如下:

list.scp文件中写入待提取的WAV文件名与提取MFCC特征后的,mfc文件名。

tr_wav.cfg文件存入提取MFCC特征的参数。

#[MODULE]  PARAMETER                 = VALUE

SOURCEKIND               = WAVEFORM

SOURCEFORMAT                  = WAV

ZMEANSOURCE                    = F               #

TARGETKIND                = MFCC_E_D_A_Z

TARGETRATE               = 100000.0 # frame period = 10msec

SAVECOMPRESSSED          = T

SAVEWITHCRC            = T

WINDOWSIZE               = 250000.0 # window size = 25msec

USEHAMMING              = T

PREEMCOEF                = 0.97                    # 1st order preemphasis, coefficient = 0.97

NUMCHANS                  = 26             # num. of filterbank channel = 26

CEPLIFTER                   = 22             # num. of cepstra = 22

NUMCEPS                     = 12             # num. of MFCC coefficient = 12

ENORMALIZE               = T               # energy normalization (live: F, otherwise: T)

ALLOWXWRDEXP                  = T               # Needed for cross word systems

FORCECXTEXP           = T               # Needed for cross word systems

#HSHELL Parameters

HSHELL:    TRACE                            = 0002                   # cotal

#HPARM Parameters

HPARM:      TRACE                            = 0101

#HLABEL Parameters

HLABEL:    TRACE                            = 0010

#HNET Parameters

HNET:         TRACE                            = 0001                   # Needed for recognition

#HREc Parameters

HREC:        FORCEOUT                   = T

在这个文件夹下打开cmd,运行 hcopy -A -D -T 1 -C tr_wav.cfg -S .\list.scp  ,即可提取出所需要.mfc文件。

成功的标志如下图所示:

参考博客:

1.https://blog.csdn.net/qq_36444303/article/details/100164507?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1.control

2.https://blog.csdn.net/jojozhangju/article/details/18714961

如何下载并使用HTK工具包相关推荐

  1. 下载centos下的工具包

    http://mirrors.163.com/centos/7/os/x86_64/Packages/ 下载centos下的工具包

  2. 基于htk工具包的语音识别

    htk简介: HTK是一个构建隐藏马尔可夫模型(HMMs)的工具包.HMMs可以用于任何时间序列的建模建模,HTK的核心就是类似的通用目的.然而,HTK主要设计用于构建基于HMM的语音处理工具,特别是 ...

  3. java微信附件下载_WxJava微信开发工具包

    下面我们对WxJava微信开发工具包文件阐述相关使用资料和WxJava微信开发工具包文件的更新信息. WxJava微信开发工具包 WxJava微信开发Java开发工具包(SDK),支持包括微信支付.微 ...

  4. HTK语音识别工具包的安装和编译

    今天介绍一下HTK语音识别工具包的安装和编译,希望能够帮助到更多做语音相关工作的同仁们. 介绍: HTK是用来进行自动语音识别研究的工具包,它由剑桥大学工程系的机器智能实验室开发的开源软件,全称叫做H ...

  5. ADB 驱动以及工具包下载安装,常见异常问题解决(亲自测试有效)1、黄色感叹号2、offline 3、unauthorized

    操作系统 win32位 首先下载驱动包和工具包(做个任务赚下C币,很快的) http://download.csdn.net/download/u012611644/10253370 解压后两个文件 ...

  6. Windows下搭建HTK

    转自:http://blog.csdn.net/yanli0823/article/details/8186382 亲测有效,环境: windows 8.1 perl版本: HTK版本:Hidden ...

  7. python调用htk工具箱_HTK学习笔记(一)在win32(win7)下安装HTK详细体验教程

    实验室有语音识别的部分,所以在离开雁栖湖之前希望自己可以掌握一些HTK语音工具的流程及知识,以便回到实验室之后会的多一点,不至于大脑一片空白 想学HTK已经有很长一段时间了,有同学建议先把 <H ...

  8. Raspberry Pi 4B安装 OpenVINO™ 工具包

    OpenVINO™ 下载树莓派使用的 OpenVINO™ 工具包 创建安装文件夹 安装外部软件依赖项 设置环境变量 为英特尔神经计算棒 2 设备添加 USB 规则 构建并运行对象检测示例 查看树莓派有 ...

  9. BeanUtils工具包操作JavaBean

    我们在操作JavaBean的时候 我们可以用Introspector的方式来操作,但是呢这样需要我们写大量的代码 . Apache小组为我们提供了很有用的工具包来操作JavaBean    也就是Be ...

最新文章

  1. centos7上搭建http服务器以及设置目录访问
  2. POJ1358 Agri-Net
  3. 2021 最流行的十大项目,新项目居榜首,总有长江后浪推前浪!
  4. mysql innodb redolog_Mysql的binlog 和InnoDB的redo-log
  5. iBATIS存储过程
  6. python将字典作为参数传入函数
  7. python | 实现多行向量(matrix)两两计算余弦距离、欧几里德距离
  8. Bailian2700 字符替换【字符串】
  9. Python3.6读写串口操作
  10. protues 仿真 12864转OLED接法
  11. ipad浏览器安装java_360浏览器苹果平板下载
  12. java 自动填充,使用java自动填充,实现mysql的创建修改时间的自动填充
  13. 随笔之大学四年生活有感
  14. css多媒体竖屏,css3 媒体查询方向:横屏竖屏教程
  15. C++20新特性全在这一张图里了
  16. div 自定义拉宽_纯Css实现Div高度根据自适应宽度(百分比)调整
  17. Regin恶意软件:何以潜伏如此久?
  18. JavaFX源码分析实战:如何设置窗体标题小图标和任务栏图标
  19. 输入命题p和q的真值,求p、q的合取、析取、异或、蕴含和等值命题的真值
  20. Win7环境下搭建Android安卓开发环境

热门文章

  1. 电脑开机密码忘记,如何修改电脑密码?
  2. chrome无法添加.crx文件(扩展程序)
  3. 为什么hadoop没有slaves配置文件?
  4. libtorch tensor的使用
  5. 基于python的ansys_基于Python与ANSYS的达芬方程计算程序
  6. 点击跳转打开新页--------window.open
  7. 权限系统的基本概念和架构
  8. 无线通信关键技术---扰码
  9. python读取csmar_wind数据转为国泰安数据 stata命令
  10. java 线程 中断标志位