<span style="font-size:18px;">
</span>

目录:

1.安装portaudio

2.编译onlinebin

3.创建脚本测试

1.安装Portaudio:

$cd ~/kaldi-trunk/tools/

$./install_portaudio.sh 这里需要修改一处配置,不然后面可能会出现这些错误

<span style="font-size:18px;">kaldi portaudio/src/hostapi/jack/pa_jack.c:1734: undefined reference to `jack_get_sample_rate</span>

2.编译onlinebin

$cd ~/kaldi-trunk/src/onlinebin/

$make

3.创建脚本测试:

$cd ~/kaldi-trunk/egs/timit/s5/exp/tri1/

$vim test_online_decode.sh

添加如下一段:

/kaldi-trunk/src/onlinebin/online-wav-gmm-decode-faster --rt-min=0.3 --rt-max=0.5 --max-active=4000 --beam=12.0 --acoustic-scale=0.0769 scp:../../data/train/split10/1/wav.scp final.mdl graph/HCLG.fst graph/words.txt '1:2:3:4:5' ark,t:trans.txt ark,t:ali.txt

$sudo ./test_online_decode.sh 运行

如果出现错误可能是由于权限不足导致,如下的错误提示:

<span style="font-size:18px;">/home/xiantao/kaldi-trunk/src/onlinebin/online-wav-gmm-decode-faster --rt-min=0.3 --rt-max=0.5 --max-active=4000 --beam=12.0 --acoustic-scale=0.0769 scp:../../data/train/split10/1/wav.scp final.mdl graph/HCLG.fst graph/words.txt 1:2:3:4:5 ark,t:trans.txt ark,t:ali.txt
ERROR (online-wav-gmm-decode-faster:TableWriter():util/kaldi-table-inl.h:1138) TableWriter: failed to write to ark,t:trans.txt
ERROR (online-wav-gmm-decode-faster:TableWriter():util/kaldi-table-inl.h:1138) TableWriter: failed to write to ark,t:trans.txt[stack trace: ]
kaldi::KaldiGetStackTrace()
kaldi::KaldiErrorMessage::~KaldiErrorMessage()
kaldi::TableWriter<kaldi::BasicVectorHolder<int> >::TableWriter(std::string const&)
/home/xiantao/kaldi-trunk/src/onlinebin/online-wav-gmm-decode-faster(main+0x783) [0x5d2730]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf5) [0x7f0f7a56eec5]
/home/xiantao/kaldi-trunk/src/onlinebin/online-wav-gmm-decode-faster() [0x5d1ee2]</span>

解码日志结果:(只有部分)

<span style="font-size:18px;">/home/xiantao/kaldi-trunk/src/onlinebin/online-wav-gmm-decode-faster --rt-min=0.3 --rt-max=0.5 --max-active=4000 --beam=12.0 --acoustic-scale=0.0769 scp:../../data/train/split10/1/wav.scp final.mdl graph/HCLG.fst graph/words.txt 1:2:3:4:5 ark,t:trans.txt ark,t:ali.txt
File: faem0_si1392
sil ax s iy m f ao r ix vcl z ae m cl p uh l ax s ix cl ch uw ey sh en w er f aa r m hh eh z ax cl p ae cl k ix ng sh eh vcl d sil ae n vcl d f iy l vcl s sil File: faem0_si2022
sil sil sil w ah dx aw f ih cl t ih sh iy vcl d r ay f ao r sil File: faem0_si762
sil f ih l s epi m ao l hh ow l ix n vcl b ow l ix th cl k l ey sil File: faem0_sx132
sil p ow vcl b l ih s ix dx iy eh n ow dx er r ay ix dx iy vcl g ow hh ae n vcl d ix n hh ae n cl s sil File: faem0_sx222
sil y uw ao l ih s cl k aa m cl w ix th cl p ae th ax l aa vcl jh ix cl k el ix vcl g z ae m cl p el s sil File: faem0_sx312
sil dh ow z ae n cl t er z w ax vcl b iy s cl t r ey cl f ao w er dx ix f y uw th iy ng cl k dh ix n th r uw cl k eh r f el iy f er s cl t sil File: faem0_sx402
sil sil sil w ih l s er v r uw vcl b aa r vcl p ay ae cl t er r ey cl ch el s cl t ao cl k sil File: faem0_sx42
sil b ih vcl d uh cl k el s cl k aa l er z aa r vcl jh y uw hh ih s cl t r iy sil File: fajw0_si1263
sil sil sil b ah hh ae v eh cl k s el eh n ix n ix vcl g r ey sh ix n ax dh ih f ih s cl k el cl p ae cl k s cl k l eh cl sh ix n y er cl k ae l ix n vcl d ix n z sil File: fajw0_si1893
sil ix cl t ix cl k ih m ax l ao ng cl t ay m cl t ax cl k m cl p ow z m s ow sil File: fajw0_si633
sil hh iy l ay cl t ix n ih cl p ih r l ow vcl b z ax v ah n s ix s cl p eh cl t ix ng vcl d ix z ix vcl d er z w ix cl t ix z n iy vcl d el sh aa cl t iy sil File: fajw0_sx183
sil sil w ay eh l s w uh vcl d ae n iy ax l aw ah dh ix z cl t ix vcl g ow sil
</span>

具体解码文件结果在这

kaldi timit 语音库在线解码应用相关推荐

  1. TIMIT语音库-----下载和matlab读取

    TIMIT语音库-----下载和matlab读取 在MIT网站可以找到一些样例, 为 16kHz sampling, 16 bit sample, PCM encoding.样例才160个句子,不够用 ...

  2. kaldi nnet3模型对单一语音文件在线解码

    文章目录 一.online2-wav-nnet3-latgen-faster 二.lattice生成脚本 三.lattice解码脚本 本文主要以kaldi中的CSJ日语数据集为例进行讲解,文中涉及的路 ...

  3. TIMIT语音库(续)

    两年前,在google的帮助下发现了完整版的TIMIT库:http://www.fon.hum.uva.nl/david/ma_ssp/2007/TIMIT/ 一时兴奋将其中的所遇到的问题公开如下:h ...

  4. Kaldi 离线在线解码应用

    环境:Ubuntu 12.04,   Kaldi timit训练完语音模型后可以进入解码, 1. 首先安装PortAudio cd /u01/kaldi/tools/portaudio ./confi ...

  5. 【kaldi】chain-model在线解码(以aishell数据集为例)

    以aishell数据集为例,演示如何进行chain-model在线解码. 1.首先生成配置文件 steps/online/nnet3/prepare_online_decoding.sh --add_ ...

  6. kaldi nnet3实时解码(使用麦克风在线解码)

    前言 好久没有更新博客,自从有小孩之后,留给自己的时间越来越少,加上最近一段时间在学习深度学习方面的理论知识,所以博客的更新拖的时间太长了. 最近经常留意到kaldi交流群中,不断有小伙伴提问有没有实 ...

  7. kaldi nnet3在线解码和chain在线解码

    chain在线解码可以参考https://blog.csdn.net/it_king1/article/details/80109398 我补充一下nnet3在线解码: nnet3跟chain不同之处 ...

  8. 【全志R329-NPU助力】Maix-Speech为嵌入式环境设计的离线语音库

    Maix-Speech是专为嵌入式环境设计的离线语音库,设计目标包括:ASR/TTS/CHAT 作者的设计初衷是完成一个低至Cortex-A7 1.0GHz 单核下可以实时运行的ASR库. 目前市面上 ...

  9. ubuntu下,在QT中利用科大讯飞语音库实现语音合成TTS

    首先要去科大讯飞语音库注册,下载linux下的在线合成TTS的SDK,然后在QT下建立一个基于控制台的工程,其实建立关于UI的也可以,问题不大,这里以控制台工程进行说明.将sample中TTS部分的t ...

最新文章

  1. [hadoop源码阅读][9]-mapreduce-概论
  2. pycharm git 超详细教程
  3. oracle 排序的分析函数,oracle下数据的排序分组row_number() over()--分析函数,可用于去重...
  4. Vue.js-Day03-AM【超级详细:Node.js环境安装、安装淘宝镜像(Win、Mac)、安装Vue脚手架、初始化Vue项目-命令解释(Vscode、命令行窗口)、目录介绍、Vue文件介绍】
  5. CodeForces - 1301C Ayoub's function(数学)
  6. 7-40 奥运排行榜 (25 分)(详解+思路+map+vector做法)兄弟们冲压呀呀呀呀呀呀呀
  7. 详解C++中的函数调用和下标以及成员访问运算符的重载
  8. Adobe illustrator 论文图形编辑和排版 - 连载 2
  9. Callable介绍
  10. jar命令更新jar中的class文件
  11. FileProvider N 7.0 升级 安装APK 选择文件 拍照 临时权限 MD
  12. 蓝桥杯 ALGO30 算法训练 入学考试 java版
  13. ECCV 2016 paper list
  14. ispalpha函数与islower
  15. 【附源码】计算机毕业设计SSM小区宠物管理系统
  16. Gilbert Strang-线性代数总结
  17. PHP在线预览word文档的功能
  18. 淘宝API item_history_price - 获取商品历史价格信息
  19. mysql 不等于 优化_Mysql优化
  20. Linux计划任务-定时任务

热门文章

  1. 小程序拼团,分销逻辑
  2. 成也简历,败也简历!
  3. 11月25日手机客户“MeeGo战略发展方向及体系架构和技术”主题活动
  4. 一维卷积神经网络原理,hopfield神经网络原理
  5. 计算机考试二级模拟试题,2015年计算机等级考试二级VB模拟试题
  6. tcp/ip网络里的客户端和服务器端 信息交流 与 安全
  7. 纵横网络靶场社区-Modbus协议
  8. 迅雷 v7.2.13.3884 新春特别版
  9. 中国首个高速公路快充网络开通
  10. 【最新】正则表达式:识别QQ号码,Email电子邮箱(163邮箱、QQ邮箱、谷歌邮箱、雅虎邮箱等等)