———更新————————–
尽量使用最新的版本,之需要改下面的第一个问题,就可以全部跑通,新的版本中beam size 是6, 就不会有问题了。


按照github上的版本直接跑的过程中遇到两个问题:
1. 在 make word graph的过程中字典正确的没有拷贝到本地:
在 14.04 下面没有问题,在16.04 下面出现问题了。

  cat $thchs/resource/dict/lexicon.txt $thchs/data_thchs30/lm_word/lexicon.txt | grep -v '<s>' | grep -v '</s>' | sort -u > data/dict/lexicon.txt || exit 1;

在16.04下面输出到文件里面是 (stand input),但是data/lang下面的文件都没有正确生成。
但是在14.04 下面是没有问题的(亲测)。
原因应该是 bash的版本不同导致的吧。
解决方法就是:
在grep 后面 加个 -a 就好了。

  1. 问题报如下错误:
    错误作者回答: https://groups.google.com/forum/#!topic/kaldi-help/S06_dri-Kcg
WARNING (gmm-align-compiled:AlignUtteranceWrapper():decoder-wrappers.cc:466) Retrying utterance A02_000 with beam 40
WARNING (gmm-align-compiled:AlignUtteranceWrapper():decoder-wrappers.cc:475) Did not successfully decode file A02_000, len = 979
WARNING (gmm-align-compiled:AlignUtteranceWrapper():decoder-wrappers.cc:466) Retrying utterance A02_001 with beam 40

具体原因:暂时不明,对对齐没有研究。

解决方法是:
将 train_mono.sh 中 gmm-align-compiled scaleopts−−beam= scale_opts --beam=beam –retry-beam= [ <script type="math/tex" id="MathJax-Element-6">[</script>beam*4
中的beam值设置的大点就好了,比如10, 50, 100 等。
太大了对结果也会有影响。
http://kaldi-asr.org/doc/faster-decoder_8h_source.html#l00033 中定义beam的时候有说明:
46 opts->Register(“beam”, &beam, “Decoding beam. Larger->slower, more accurate.”);

kaldi中跑thchs30相关推荐

  1. 语音识别实践、Kaldi下跑清华30小时例程(thchs30)笔记

    这一周在kaldi下跑thchs30例程,做了些笔记,记录一下(黑体字是要运行的命令,实际上是从run.sh分离出来的) 如果自行下载语料的话,推荐一个openslr的镜像网址,速度快很多 http: ...

  2. gentos 执行sh文件_学习kaldi跑thchs30记录(run.sh代码过程)

    cmd.sh:运行配置目录,并行执行命令,通常分 run.pl, queue.pl 两种 path.sh:环境变量相关脚本(kaldi公用的全局PATH变量的设置) run.sh :整体流程控制脚本, ...

  3. 运行kaldi中遇到的问题总结

    最近在跑kaldi中的程序,中间遇到了一些问题,总结一下,之后还会不断更新. 2018/5/30 1.问题: "在运行中run.sh时遇到 "queue.pl: Error sub ...

  4. kaldi中的深度神经网络

    这个文档主要来说kaldi中Karel Vesely部分的深度神经网络代码. 如果想了解kaldi的全部深度神经网络代码,请Deep Neural Networks in Kaldi, 和Dan的版本 ...

  5. kaldi中的声纹识别

    kaldi中的声纹识别 文章目录 kaldi中的声纹识别 kaldi的安装 运行aishell例程 使用TIMIT数据库进行声纹识别 kaldi中声纹识别的流程 我的博客:https://yutouw ...

  6. kaldi中的数据准备

    数据准备 译者:V (shiwei@sz.pku.edu.cn)  水平有限,如有错误请多包涵.   @wbglearn校对. 介绍 在运行完示例脚本后(见Kaldi tutorial),你可能会想用 ...

  7. TPC-C 中跑赢 Oracle 的 OceanBase,双 11 处理峰值达 6100 万次/秒!

    作者 | 晶少 责编 | 阿秃 出品 | CSDN云计算(ID:CSDNcloud) 就在一年一度震撼人心的双11前夕,有消息称前段时间火爆到瞬间刷屏的OceanBase已经完成了Oracle模式的研 ...

  8. Kaldi中 声纹识别的流程图

    总结了一波Kaldi中声纹识别的流程和所用的可执行文件,. 把可执行文件当作一个库来用,自己来仿照这sre08,sre10,或者aishell的run.sh用自己的数据来完成自己的声纹识别系统就好. ...

  9. kaldi中hashlist阅读总结

    kaldi中的解码算法里,需要记录很多的令牌(token).每个令牌,都是一条路径的"头",通过这个令牌回溯,就可以得到一条完整的路径.如果解码到最后一帧,从所有的令牌中,找到得分 ...

最新文章

  1. iOS App上架流程
  2. C#编程规范--控件命名篇[转]
  3. 个人博客系统的设计与实现_一个 Go 开发的快速、简洁、美观、前后端分离的个人博客系统...
  4. mybatis-plus自定义mapper报org.apache.ibatis.binding.BindingException: Invalid bound statement(not found)
  5. 视频直播中 | 5G到底有多快?现场测速,带你走进5G生活
  6. linux终端配备时钟oh-my-zsh主题
  7. 445. 两数相加 II golang
  8. list的contains方法为什么不好使_道理都懂,为什么我们还打不好网球?
  9. 【爬虫】爬取冰冰第一条视频,保存至csv文件(多页爬取)
  10. 花书+吴恩达深度学习(二二)自编码器(欠完备,DAE,CAE,PSD)
  11. vue ---- vue 的入门程序
  12. 二叉树的遍历 C/C++语言实现
  13. 数据结构上机实践第13周项目1 - 验证Prim算法的验证
  14. 多学一点(十二)——使用extundelete恢复Linux下误删除文件
  15. dev:dev fatal: HttpRequestException encountered. remote: Invalid username or password. fatal: Authen
  16. Nginx支持ipv6
  17. 年度收官技术盛宴SD2.0大会精彩议题曝光
  18. Opencv -- 18图像像素类型转换与归一化
  19. redis 基础教程
  20. 来淄博旅游 C 2055

热门文章

  1. 《程序员的自我修养》第4章---静态链接
  2. 计算机应用专业买笔记本还是平板,平板电脑pk笔记本 哪种更适合你
  3. 读林博士写好代码十个秘诀
  4. 去中心化的 React Native 架构探索
  5. ThinkPad SL410 安装XP系统需要注意的地方
  6. oracle不能写入注册表,保存注册表时提示无法创建值,写入注册表时出错怎么办?...
  7. JS将某个数组分割为N个对象一组(如,两两一组,三三一组等)
  8. 计算机读书笔记10000,网络营销读书笔记10000字
  9. 河南省对口升学计算机专业试卷,河南省2017年普通高等学校对口升学计算机类专业课试题卷...
  10. 2023年,千万别裸辞....