推荐 | 实用的开源数据(更新中)
巧妇难为无米之炊,今天的推荐是两套开源数据。关注本博客或者公众号的朋友,可能一部分是已经在做自己的课题或者项目,可以直接使用本站这些脚本或者程序的;也有的刚在学习进行中,那么手头可能未必会有合适的数据来进行实验或者提取,分析。这篇文章的目的,为大家推荐两套开源数据库,这些数据有wav和标注好的结果,可以直接用来提取参数,了解实验过程。开源数量是公开免费使用的,但是不能用做商业用途,拿来用做学术研究,写论文都是没问题的,原则上要注明出处。
第一个中文数据是普通话音库,来自标贝公司(https://www.data-baker.com/index.html),这是一套专门用于语音合成的标准普通话女声音库,共10小时,所有音频wav都有人工精标注。从录音质量上来说,标贝的这套几乎可以称为完美。音质非常清楚,而且有人工精标注的音素信息,这可以说是业界良心了。下载地址是:https://www.data-baker.com/open_source.html,在此页的最下方有“数据下载”,并且有数据和版权说明等;
第二套是英语的CMU(http://www.speech.cs.cmu.edu/databases/)数据库。我的下载方式是在下载HTS合成工具包的时候,它的Demo里自带的数据http://hts.sp.nitech.ac.jp/?Download,这里面带了CMU的英语数据1000句,是raw格式的;
- 为什么要二次处理这两个数据库
首先这个中文数据下载了之后是三个文件:
Wave.rar, ProsodyLabeling.rar, PhoneLabeling.rar
分别解压之后:
第一个压缩包,Wave.rar,这里面是wav格式的音频,都是在专业录音棚录制的,共10000句,采样率是48K;
第二个压缩包,ProsodyLabeling.rar, 解压之后,是一个文本文件,打开之后如下,这里面的#2等信息在网站有说明,是韵律停顿信息;
000001 卡尔普#2陪外孙#1玩滑梯#4。 ka2 er2 pu3 pei2 wai4 sun1 wan2 hua2 ti1000002 假语村言#2别再#1拥抱我#4。 jia2 yu3 cun1 yan2 bie2 zai4 yong1 bao4 wo3 000003 宝马#1配挂#1跛骡鞍#3,貂蝉#1怨枕#2董翁榻#4。 bao2 ma3 pei4 gua4 bo3 luo2 an1 diao1 chan2 yuan4 zhen3 dong3 weng1 ta4
https://www.data-baker.com/open_source.html
- 第三个压缩包,PhoneLabeling.rar,解压之后,是上述10000句音频的人工精标信息,包括音素,以及音素的时间点信息,可以直接用Praat打开:
所以现在这里二次处理的方式就是通过程序,将汉字和音素(拼音)结合起来放在一个TextGrid里,即:
这样更适合于想通过脚本练习提取数据分析的朋友,除了第一层的人工标注音素信息,在第二层将第二个压缩包的韵律信息融合;
第二个英语数据库,这个下载了之后,是只有raw格式的音频,我这里通过cooledit将它转化成16K的wav,网站还有这些音频对应的英语句子内容:
cmu_us_arctic_slt_a0001: Author of the danger trail, Philip Steels, etc.
如果能将发音也做成TextGrid的形式,对于直接使用数据提取参数也是很有帮助的。这个数据库由于没有直接的人工标注数据,这里采用的是montreal alignment这个对齐工具(http://montreal-forced-aligner.readthedocs.io)自动对齐的结果,这里使用的音素符号要去montreal alignment的网站去查看。
下载地址
https://github.com/feelins/Praat_Scripts/tree/master/data
点击每个rar文件可以找到download,直接下载即可。
推荐 | 实用的开源数据(更新中)相关推荐
- 编程办公实用工具(不断更新中。。。)
对于现在的程序员而言,在编程敲代码时必不可缺少就是一些好用的工具.这些工具不仅仅可以提高编程开发的效率,还可以更加高效地完成工作. 以下是我对一些自己认为在工作过程中对自己帮助比较大有实际作用的工具的 ...
- .net core优秀开源项目(更新中)
ZCN.NET.Common 国内技术牛人开源的一个工具库,拿来即用 博客地址 ZCN.NET.Common 介绍 [ZCN.NET.Common]是基于.NET Standard 技术封装的二次开发 ...
- html css js知识整理,Html+Css+Js实用知识汇总(持续更新中...)
Html篇 基本概念: html:超文本标记语言(Hyper Text Markup Language) html5:下一代的html xhtml:更严谨更纯净的html 表头 网站标题 //页面编码 ...
- 推荐一些我觉得非常实用的工具、网站、资源等——持续更新中
推荐一些我觉得非常实用的工具.网站(不限于GISer hh)--持续更新中 如需转载本文,请征询笔者并注明来源,谢谢 文章目录 推荐一些我觉得非常实用的工具.网站(不限于GISer hh)--持续更新 ...
- 电机轴承故障相关的开源数据(不断更新中)
电机轴承故障相关的开源数据 参考链接出处:电机轴承故障相关的开源数据 1.西储大学轴承数据 使用较多,数据链接: 西储大学数据链接 在python中自动下载的技术 2.美国-机械故障预防技术学会MFP ...
- Android开源项目以及开源库集合(持续更新中)
UI Awesome-MaterialDesign – MaterialDesignCenter改名为Awesome-MaterialDesign,优化了布局,新增了不少库. awesome-andr ...
- 嵌入式相关开源项目、库、资料------持续更新中
学习初期最难找的就是找学习资料了,本贴精心汇总了一些嵌入式相关资源,包括但不限于编程语言.单片机.开源项目.物联网.操作系统.Linux.计算机等资源,并且在不断地更新中,致力于打造全网最全的嵌入式资 ...
- 这些开源项目,你都知道吗?(持续更新中...)[原创]
原文 这些开源项目,你都知道吗?(持续更新中...)[原创] Json.NET http://json.codeplex.com/ Json.Net是一个读写Json效率比较高的.Net框架.Json ...
- 关于大数据相关的问答汇总,每天持续更新中哦~
NO.1 想要学好大数据需掌握哪些技术? 答:1,Java编程技术 Java编程技术是大数据学习的基础,Java是一种强类型语言,拥有极高的跨平台能力,可以编写桌面应用程序.Web应用程序.分布式系统 ...
最新文章
- 读 MySQL 源码再看 INSERT 加锁流程
- 操作系统老师上课讲的那个根据I/O时间和CPU时间比例来为进程分配优先级的题目,I/O时间比例越大,则这个进程的优先级越高
- 声明和定义结构体需要注意的问题
- Excel2019(Office 2019)导入数据网页(文本txt)无法显示以前样式的问题(终极解决方案)
- mysql 内存占用过多的解决方法
- 洛谷 P2689 东南西北【模拟/搜索】
- 计算机的flash player在哪里,flash player电脑设置管理器在哪?怎么打开
- ubuntu mysql无法启动服务器_ubuntu – Mysql无法启动mysqld.sock缺失
- 各互联网技术领域pdf图书合集(百度网盘)
- win8 java download failed_VC2017无法安装 系统win8.1 错误代码0x80240017
- 北京 | 微信小程序及小游戏开发者线下交流会
- mysql异地灾备架构_最佳实践 数据库异地灾备
- 视频断点续传+java视频
- 【springboot进阶】RestTemplate 集成 okhttp3 请求带p12证书
- 华为苹果两家独霸中国高端手机市场,4000元以上份额合计近九成
- 【windows】jar包不显示java图标,反而显示的是白色
- WAP、WIFI、CMWAP、CMNET上网方式的区别与联系
- 24核超级计算机,从CPU内部详解电脑CPU的性能:24核CPU什么样?
- uni-app在内网环境中使用editor组件,报错问题修复
- 三次站队,两次狗血晋升,从月薪500到身价1400亿:选择真比努力重要!
热门文章
- Android Preference 笔记
- html css输入框获得焦点、失去焦点效果
- 图集php源码,「亲测」2020最新开源php图床源码v2.1.3 免授权无后门+搭建教程
- Macbook如何通过一行指令实现mkv格式视频转mp4格式
- 日化美妆如何在高德地图上投放广告?高德地图投放广告的效果
- 安装vue脚手架报错
- 用devc++表白_表白 | 大三,女,想找一个长得帅的175以上的小哥哥谈恋爱
- ns传说对决不显示服务器,ns传说对决搜索不到怎么回事?任天堂ns商店怎么设置为中文?...
- 中学生用计算机的警句,中学生名言大全
- 西游释厄转Java_西游记释厄传DNF鬼剑士版