kaldi timit 语音库在线解码应用
<span style="font-size:18px;">
</span>
目录:
1.安装portaudio
2.编译onlinebin
3.创建脚本测试
1.安装Portaudio:
$cd ~/kaldi-trunk/tools/
$./install_portaudio.sh 这里需要修改一处配置,不然后面可能会出现这些错误
<span style="font-size:18px;">kaldi portaudio/src/hostapi/jack/pa_jack.c:1734: undefined reference to `jack_get_sample_rate</span>
2.编译onlinebin
$cd ~/kaldi-trunk/src/onlinebin/
$make
3.创建脚本测试:
$cd ~/kaldi-trunk/egs/timit/s5/exp/tri1/
$vim test_online_decode.sh
添加如下一段:
/kaldi-trunk/src/onlinebin/online-wav-gmm-decode-faster --rt-min=0.3 --rt-max=0.5 --max-active=4000 --beam=12.0 --acoustic-scale=0.0769 scp:../../data/train/split10/1/wav.scp final.mdl graph/HCLG.fst graph/words.txt '1:2:3:4:5' ark,t:trans.txt ark,t:ali.txt
$sudo ./test_online_decode.sh 运行
如果出现错误可能是由于权限不足导致,如下的错误提示:
<span style="font-size:18px;">/home/xiantao/kaldi-trunk/src/onlinebin/online-wav-gmm-decode-faster --rt-min=0.3 --rt-max=0.5 --max-active=4000 --beam=12.0 --acoustic-scale=0.0769 scp:../../data/train/split10/1/wav.scp final.mdl graph/HCLG.fst graph/words.txt 1:2:3:4:5 ark,t:trans.txt ark,t:ali.txt
ERROR (online-wav-gmm-decode-faster:TableWriter():util/kaldi-table-inl.h:1138) TableWriter: failed to write to ark,t:trans.txt
ERROR (online-wav-gmm-decode-faster:TableWriter():util/kaldi-table-inl.h:1138) TableWriter: failed to write to ark,t:trans.txt[stack trace: ]
kaldi::KaldiGetStackTrace()
kaldi::KaldiErrorMessage::~KaldiErrorMessage()
kaldi::TableWriter<kaldi::BasicVectorHolder<int> >::TableWriter(std::string const&)
/home/xiantao/kaldi-trunk/src/onlinebin/online-wav-gmm-decode-faster(main+0x783) [0x5d2730]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf5) [0x7f0f7a56eec5]
/home/xiantao/kaldi-trunk/src/onlinebin/online-wav-gmm-decode-faster() [0x5d1ee2]</span>
解码日志结果:(只有部分)
<span style="font-size:18px;">/home/xiantao/kaldi-trunk/src/onlinebin/online-wav-gmm-decode-faster --rt-min=0.3 --rt-max=0.5 --max-active=4000 --beam=12.0 --acoustic-scale=0.0769 scp:../../data/train/split10/1/wav.scp final.mdl graph/HCLG.fst graph/words.txt 1:2:3:4:5 ark,t:trans.txt ark,t:ali.txt
File: faem0_si1392
sil ax s iy m f ao r ix vcl z ae m cl p uh l ax s ix cl ch uw ey sh en w er f aa r m hh eh z ax cl p ae cl k ix ng sh eh vcl d sil ae n vcl d f iy l vcl s sil File: faem0_si2022
sil sil sil w ah dx aw f ih cl t ih sh iy vcl d r ay f ao r sil File: faem0_si762
sil f ih l s epi m ao l hh ow l ix n vcl b ow l ix th cl k l ey sil File: faem0_sx132
sil p ow vcl b l ih s ix dx iy eh n ow dx er r ay ix dx iy vcl g ow hh ae n vcl d ix n hh ae n cl s sil File: faem0_sx222
sil y uw ao l ih s cl k aa m cl w ix th cl p ae th ax l aa vcl jh ix cl k el ix vcl g z ae m cl p el s sil File: faem0_sx312
sil dh ow z ae n cl t er z w ax vcl b iy s cl t r ey cl f ao w er dx ix f y uw th iy ng cl k dh ix n th r uw cl k eh r f el iy f er s cl t sil File: faem0_sx402
sil sil sil w ih l s er v r uw vcl b aa r vcl p ay ae cl t er r ey cl ch el s cl t ao cl k sil File: faem0_sx42
sil b ih vcl d uh cl k el s cl k aa l er z aa r vcl jh y uw hh ih s cl t r iy sil File: fajw0_si1263
sil sil sil b ah hh ae v eh cl k s el eh n ix n ix vcl g r ey sh ix n ax dh ih f ih s cl k el cl p ae cl k s cl k l eh cl sh ix n y er cl k ae l ix n vcl d ix n z sil File: fajw0_si1893
sil ix cl t ix cl k ih m ax l ao ng cl t ay m cl t ax cl k m cl p ow z m s ow sil File: fajw0_si633
sil hh iy l ay cl t ix n ih cl p ih r l ow vcl b z ax v ah n s ix s cl p eh cl t ix ng vcl d ix z ix vcl d er z w ix cl t ix z n iy vcl d el sh aa cl t iy sil File: fajw0_sx183
sil sil w ay eh l s w uh vcl d ae n iy ax l aw ah dh ix z cl t ix vcl g ow sil
</span>
具体解码文件结果在这
kaldi timit 语音库在线解码应用相关推荐
- TIMIT语音库-----下载和matlab读取
TIMIT语音库-----下载和matlab读取 在MIT网站可以找到一些样例, 为 16kHz sampling, 16 bit sample, PCM encoding.样例才160个句子,不够用 ...
- kaldi nnet3模型对单一语音文件在线解码
文章目录 一.online2-wav-nnet3-latgen-faster 二.lattice生成脚本 三.lattice解码脚本 本文主要以kaldi中的CSJ日语数据集为例进行讲解,文中涉及的路 ...
- TIMIT语音库(续)
两年前,在google的帮助下发现了完整版的TIMIT库:http://www.fon.hum.uva.nl/david/ma_ssp/2007/TIMIT/ 一时兴奋将其中的所遇到的问题公开如下:h ...
- Kaldi 离线在线解码应用
环境:Ubuntu 12.04, Kaldi timit训练完语音模型后可以进入解码, 1. 首先安装PortAudio cd /u01/kaldi/tools/portaudio ./confi ...
- 【kaldi】chain-model在线解码(以aishell数据集为例)
以aishell数据集为例,演示如何进行chain-model在线解码. 1.首先生成配置文件 steps/online/nnet3/prepare_online_decoding.sh --add_ ...
- kaldi nnet3实时解码(使用麦克风在线解码)
前言 好久没有更新博客,自从有小孩之后,留给自己的时间越来越少,加上最近一段时间在学习深度学习方面的理论知识,所以博客的更新拖的时间太长了. 最近经常留意到kaldi交流群中,不断有小伙伴提问有没有实 ...
- kaldi nnet3在线解码和chain在线解码
chain在线解码可以参考https://blog.csdn.net/it_king1/article/details/80109398 我补充一下nnet3在线解码: nnet3跟chain不同之处 ...
- 【全志R329-NPU助力】Maix-Speech为嵌入式环境设计的离线语音库
Maix-Speech是专为嵌入式环境设计的离线语音库,设计目标包括:ASR/TTS/CHAT 作者的设计初衷是完成一个低至Cortex-A7 1.0GHz 单核下可以实时运行的ASR库. 目前市面上 ...
- ubuntu下,在QT中利用科大讯飞语音库实现语音合成TTS
首先要去科大讯飞语音库注册,下载linux下的在线合成TTS的SDK,然后在QT下建立一个基于控制台的工程,其实建立关于UI的也可以,问题不大,这里以控制台工程进行说明.将sample中TTS部分的t ...
最新文章
- [hadoop源码阅读][9]-mapreduce-概论
- pycharm git 超详细教程
- oracle 排序的分析函数,oracle下数据的排序分组row_number() over()--分析函数,可用于去重...
- Vue.js-Day03-AM【超级详细:Node.js环境安装、安装淘宝镜像(Win、Mac)、安装Vue脚手架、初始化Vue项目-命令解释(Vscode、命令行窗口)、目录介绍、Vue文件介绍】
- CodeForces - 1301C Ayoub's function(数学)
- 7-40 奥运排行榜 (25 分)(详解+思路+map+vector做法)兄弟们冲压呀呀呀呀呀呀呀
- 详解C++中的函数调用和下标以及成员访问运算符的重载
- Adobe illustrator 论文图形编辑和排版 - 连载 2
- Callable介绍
- jar命令更新jar中的class文件
- FileProvider N 7.0 升级 安装APK 选择文件 拍照 临时权限 MD
- 蓝桥杯 ALGO30 算法训练 入学考试 java版
- ECCV 2016 paper list
- ispalpha函数与islower
- 【附源码】计算机毕业设计SSM小区宠物管理系统
- Gilbert Strang-线性代数总结
- PHP在线预览word文档的功能
- 淘宝API item_history_price - 获取商品历史价格信息
- mysql 不等于 优化_Mysql优化
- Linux计划任务-定时任务
热门文章
- 小程序拼团,分销逻辑
- 成也简历,败也简历!
- 11月25日手机客户“MeeGo战略发展方向及体系架构和技术”主题活动
- 一维卷积神经网络原理,hopfield神经网络原理
- 计算机考试二级模拟试题,2015年计算机等级考试二级VB模拟试题
- tcp/ip网络里的客户端和服务器端 信息交流 与 安全
- 纵横网络靶场社区-Modbus协议
- 迅雷 v7.2.13.3884 新春特别版
- 中国首个高速公路快充网络开通
- 【最新】正则表达式:识别QQ号码,Email电子邮箱(163邮箱、QQ邮箱、谷歌邮箱、雅虎邮箱等等)