中文普通话语音识别开源数据集(持续更新)
中文普通话语音识别开源数据集,截止到2022.11.21
数据集 | 时长(h) | 人数 | 标注准确率 | 下载链接 | 开源协议 | 备注 |
thchs30 | 30 | 40 | - | openslr.org | Apache License v.2.0 | - |
Primewords_set1 | 100 | 296 | >98% | openslr.org | CC BY-NC-ND 4.0 | - |
aishell1 | 178 | 400 | >95% | openslr.org | Apache License v.2.0 | - |
ST-CMDS | 122 | 855 | - | openslr.org | CC BY-NC-ND 4.0 | - |
aishell2 | 1000 | 1991 | >96% | 希尔贝壳—专注于人工智能大数据和技术的创新 | - | 需要申请 |
aidatatang_200zh | 200 | 600 | >98% | openslr.org | CC BY-NC-ND 4.0 | - |
aidatatang_1505zh | 1505 | 6408 | >98% | 数据堂-AI数据服务-人工智能数据采集与标注 | CC BY-NC-ND 4.0 | 需要申请 |
Speechocean | 10.33 | 20 | >98% | openslr.org | CC BY-NC-ND 4.0 | - |
MAGICDATA | 755 | 1080 | >98% | openslr.org | CC BY-NC-ND 4.0 | - |
Common Voice | 70 | 3333 | - | Common Voice | CC-0 | mp3格式 |
aishell3 | 85 | 218 | >98% | openslr.org | Apache License v.2.0 | |
TAL_ASR | 100 | 80+ | 好未来AI开放平台-数据集 (100tal.com) | 注册即可下载 | ||
WenetSpeech | 10000 | ≥95% | WenetSpeech (wenet-e2e.github.io) | CC BY 4.0 | 填写表格审核通过后下载 | |
MAGICDATA Conversational | 180 | 663 | openslr.org | CC BY-NC-ND 4.0 |
中文普通话语音识别开源数据集(持续更新)相关推荐
- 科学网—中文普通话语音识别DEMO,LilyMandarinSpeechRecognition V1.0 - 石自强的博文...
DEMO简介: 这是一个中文普通话语音识别的最简单DEMO,LilyMandarinSpeechRecognition V1.0. 首先给出这款软件的下载链接: 或者 http://vdisk.wei ...
- 基于HTK中文普通话语音识别DEMO,LilyMandarinSpeechRecognition V1.0
DEMO简介: 这是一个中文普通话语音识别的最简单DEMO,LilyMandarinSpeechRecognition V1.0. 首先给出这款软件的下载链接: DEMO_LilyMandarinSp ...
- Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(持续更新)
Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(建议收藏,持续更新) 目录 CV常用数据集平台集合 Mendeley Data CAISA-Web ...
- 深度学习中的遥感影像数据集~持续更新
收集网络上公开的遥感数据集,欢迎补充 以下数据集均为网上开源数据集,若有遗误或不慎涉及侵权,烦请评论或留言联系 目前本项目共整理 场景分类数据集27个(整理完结): 目标检测数据集31+个(整理完结) ...
- python使用Sphinx实现中文普通话语音识别
python实现中文语音识别有很多种方法. 国内有百度的免费的60s的Python SDK语音识别,我尝试过,感觉识别率不高,而且识别的时间不短,还要求联网. 在github找了几个关于语音识别的包. ...
- 【收集】NLP语料库数据集+持续更新
来源:大数据文摘 本文共4270字,建议阅读7分钟. 本文为你奉上100多个按字母顺序排列的开源自然语言处理文本数据集列表. 奉上100多个按字母顺序排列的开源自然语言处理文本数据集列表(原始未结构化 ...
- 「吓掉半条命」软件开源「持续更新」
目录 前言: 介绍: 条款: 关于本应用商业用途及合作事宜: 关于商用处理: 关于代码开放原则: 附: 国庆: g: 1.0: 1.1: 1.2: 1.3: 1.4: 1.5: 1.6: 1.7: 1 ...
- TKDragView_iOS开发常用第三方开源框架 持续更新中...
网络请求 AFNetworking Alamofire AFNetworking swift版本 YTKNetwork AFNetworking的封装 YQNetworking 基于AFNetwork ...
- 机器学习数据集(持续更新)
1.手写数字数据集 百度云盘:手写数字 .csv 格式,链接: https://pan.baidu.com/s/1Wg2fKqBoeXiNJ3c8K4DnDg 密码: 7wmq 百度云盘:手写数字.j ...
最新文章
- 远离这样的管理层:靠加班、靠团建、靠个人
- 使用uniapp开发婚庆应用的时候开发公共组件请求网络数据的方式
- php sql 时间 函数,PHP模拟SQL Server的两个日期处理函数
- 第12章 样式(三)
- vue实现网络图片瀑布流 + 下拉刷新 + 上拉加载更多
- hdoj2955 Robberies(01背包)
- (转贴)正则表达式学习心得体会(1)
- WareZ入门指南--TLF元老thunderlight
- 一建工程经济的关键数据推导及关键记忆点
- 下载安装Tomcat8.5.30
- 链接脚本中 text、data、bss、rodata 段含义
- bowtie:短序列比对的新工具
- 如何进行特征工程,以及特征工程的一些理论
- Python描述 LeetCode 1037. 有效的回旋镖
- 系统资源不住无法完成请求的服务器,windows10系统提示“系统资源不足,无法完成请求的服务”怎么办...
- config:配置中心
- 大公司为什么很少招易语言程序员
- 好男儿志在四方,投笔从戎报效祖国!
- 标准成本法,你的优势在哪?(转贴)
- zigbee CC2530 系列教程 5 外部中断实验
热门文章
- mx linux默认字体,世界排名第一的Linux系统—MX Linux 19.2 KDE 版正式发布
- 命令行--cd命令的使用
- Java线程模仿电影院买票
- 百趣代谢组学解读,深度解码蜜蜂肠菌调节宿主行为和神经功能
- springboot thymeleaf遍历List集合
- 小编为大家整理的14张学习python的全套思维导图
- 歪果仁是如何过黑五的
- 学Python划重点 五 (处理Excel、Word、PDF实例)
- 大咖 | 霍金学生、计算机视觉领域奠基人Alan Yuille:AI的进步需要基础理论上有所发展
- 2022-02-28 keil中include“arm_math.h“的问题