中文普通话语音识别开源数据集,截止到2022.11.21

数据集 时长(h) 人数 标注准确率 下载链接 开源协议 备注
thchs30 30 40 - openslr.org Apache License v.2.0 -
Primewords_set1 100 296 >98% openslr.org CC BY-NC-ND 4.0 -
aishell1 178 400 >95% openslr.org Apache License v.2.0 -
ST-CMDS 122 855 - openslr.org CC BY-NC-ND 4.0 -
aishell2 1000 1991 >96% 希尔贝壳—专注于人工智能大数据和技术的创新 - 需要申请
aidatatang_200zh 200 600 >98% openslr.org CC BY-NC-ND 4.0 -
aidatatang_1505zh 1505 6408 >98% 数据堂-AI数据服务-人工智能数据采集与标注 CC BY-NC-ND 4.0 需要申请
Speechocean 10.33 20 >98% openslr.org CC BY-NC-ND 4.0 -
MAGICDATA 755 1080 >98% openslr.org CC BY-NC-ND 4.0 -
Common Voice 70 3333 - Common Voice CC-0 mp3格式
aishell3 85 218 >98% openslr.org Apache License v.2.0
TAL_ASR 100 80+ 好未来AI开放平台-数据集 (100tal.com) 注册即可下载
WenetSpeech 10000 ≥95% WenetSpeech (wenet-e2e.github.io) CC BY 4.0 填写表格审核通过后下载
MAGICDATA  Conversational  180  663 openslr.org CC BY-NC-ND 4.0

中文普通话语音识别开源数据集(持续更新)相关推荐

  1. 科学网—中文普通话语音识别DEMO,LilyMandarinSpeechRecognition V1.0 - 石自强的博文...

    DEMO简介: 这是一个中文普通话语音识别的最简单DEMO,LilyMandarinSpeechRecognition V1.0. 首先给出这款软件的下载链接: 或者 http://vdisk.wei ...

  2. 基于HTK中文普通话语音识别DEMO,LilyMandarinSpeechRecognition V1.0

    DEMO简介: 这是一个中文普通话语音识别的最简单DEMO,LilyMandarinSpeechRecognition V1.0. 首先给出这款软件的下载链接: DEMO_LilyMandarinSp ...

  3. Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(持续更新)

    Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(建议收藏,持续更新) 目录 CV常用数据集平台集合 Mendeley Data CAISA-Web ...

  4. 深度学习中的遥感影像数据集~持续更新

    收集网络上公开的遥感数据集,欢迎补充 以下数据集均为网上开源数据集,若有遗误或不慎涉及侵权,烦请评论或留言联系 目前本项目共整理 场景分类数据集27个(整理完结): 目标检测数据集31+个(整理完结) ...

  5. python使用Sphinx实现中文普通话语音识别

    python实现中文语音识别有很多种方法. 国内有百度的免费的60s的Python SDK语音识别,我尝试过,感觉识别率不高,而且识别的时间不短,还要求联网. 在github找了几个关于语音识别的包. ...

  6. 【收集】NLP语料库数据集+持续更新

    来源:大数据文摘 本文共4270字,建议阅读7分钟. 本文为你奉上100多个按字母顺序排列的开源自然语言处理文本数据集列表. 奉上100多个按字母顺序排列的开源自然语言处理文本数据集列表(原始未结构化 ...

  7. 「吓掉半条命」软件开源「持续更新」

    目录 前言: 介绍: 条款: 关于本应用商业用途及合作事宜: 关于商用处理: 关于代码开放原则: 附: 国庆: g: 1.0: 1.1: 1.2: 1.3: 1.4: 1.5: 1.6: 1.7: 1 ...

  8. TKDragView_iOS开发常用第三方开源框架 持续更新中...

    网络请求 AFNetworking Alamofire AFNetworking swift版本 YTKNetwork AFNetworking的封装 YQNetworking 基于AFNetwork ...

  9. 机器学习数据集(持续更新)

    1.手写数字数据集 百度云盘:手写数字 .csv 格式,链接: https://pan.baidu.com/s/1Wg2fKqBoeXiNJ3c8K4DnDg 密码: 7wmq 百度云盘:手写数字.j ...

最新文章

  1. 远离这样的管理层:靠加班、靠团建、靠个人
  2. 使用uniapp开发婚庆应用的时候开发公共组件请求网络数据的方式
  3. php sql 时间 函数,PHP模拟SQL Server的两个日期处理函数
  4. 第12章 样式(三)
  5. vue实现网络图片瀑布流 + 下拉刷新 + 上拉加载更多
  6. hdoj2955 Robberies(01背包)
  7. (转贴)正则表达式学习心得体会(1)
  8. WareZ入门指南--TLF元老thunderlight
  9. 一建工程经济的关键数据推导及关键记忆点
  10. 下载安装Tomcat8.5.30
  11. 链接脚本中 text、data、bss、rodata 段含义
  12. bowtie:短序列比对的新工具
  13. 如何进行特征工程,以及特征工程的一些理论
  14. Python描述 LeetCode 1037. 有效的回旋镖
  15. 系统资源不住无法完成请求的服务器,windows10系统提示“系统资源不足,无法完成请求的服务”怎么办...
  16. config:配置中心
  17. 大公司为什么很少招易语言程序员
  18. 好男儿志在四方,投笔从戎报效祖国!
  19. 标准成本法,你的优势在哪?(转贴)
  20. zigbee CC2530 系列教程 5 外部中断实验

热门文章

  1. mx linux默认字体,世界排名第一的Linux系统—MX Linux 19.2 KDE 版正式发布
  2. 命令行--cd命令的使用
  3. Java线程模仿电影院买票
  4. 百趣代谢组学解读,深度解码蜜蜂肠菌调节宿主行为和神经功能
  5. springboot thymeleaf遍历List集合
  6. 小编为大家整理的14张学习python的全套思维导图
  7. 歪果仁是如何过黑五的
  8. 学Python划重点 五 (处理Excel、Word、PDF实例)
  9. 大咖 | 霍金学生、计算机视觉领域奠基人Alan Yuille:AI的进步需要基础理论上有所发展
  10. 2022-02-28 keil中include“arm_math.h“的问题