Leaderboard 项目新增基于 WenetSpeech 数据集的 WeNet 预训练模型,识别准确率如下:

具体数字如下:

该模型可与之前发布的开源测试集配合使用,进行本地复现和验证,模型的下载命令为:

ops/pull  model  wenet_wenetspeech

测试集的下载命令见上几篇历史文章。

简评:

  • 从数字可以看出,基于 WenetSpeech 数据集的 WeNet 模型在性能上已经超过了百度的付费商业引擎,逼近行业头部商业引擎的 [SOTA] 均值。

  • 从数据到框架的全栈开源系统,在性能上开始超越商业付费系统的案例,在很多技术领域的发展历史中都可以找到,对本行业的意义自不必多说。

  • 仔细对比上述评测数字差异,公众号的读者朋友们可以切实感受一下数据对于模型性能的重要性。现阶段AI行业的实际落地,刻意回避数据,只强调技术优越性的人,短视与欺骗必占其一。People lie, numbers don't

  • 祝贺 WeNet 团队。

语音之家SOTA|Leaderboard 新增 WenetSpeech 数据集预训练 WeNet 模型相关推荐

  1. 王小川新公司开源 70 亿参数量的中英文预训练大模型,可商用;谷歌要求员工慎用 AI,即便是自己家的 Bard|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  2. 王小川新公司开源 70 亿参数量的中英文预训练大模型,可商用;谷歌要求员工慎用 AI,即便是自己家的 Bard|极客头条...

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  3. pascal行人voc_在Pascal VOC 数据集上训练YOLOv3模型

    上节介绍了<从零开始在Windows10中编译安装YOLOv3>,本节介绍在Pascal VOC 数据集上训练YOLOv3. 第一步,下载并安装YOLOv3训练依赖项. a.下载Pasca ...

  4. 语音之家SOTA | 同声传译现场 时政

    SpeechIO TIOBE Benchmark 场景测试:同声传译现场 时政 1.素材来源 YouTube 爬取美联储.白宫发布会.政要座谈会等时政素材的中文同传现场,原始时长约两个半小时. 场景上 ...

  5. 语音之家SOTA | TIOBE 场景测试:电台节目 张震鬼故事

    SpeechIO TIOBE Benchmark 场景测试:电台节目 张震鬼故事 1.素材来源 YouTube 抓取"张震鬼故事" 往期节目,原始音频约3小时 2.场景特点 环境 ...

  6. 语音之家SOTA|开源发布: SPEECHIO_ASR_ZH00004 罗振宇跨年演讲

    本期开源发布为 [罗振宇跨年演讲] 场景,测试集ID: SPEECHIO_ASR_ZH00004 获取方式: 平台:Linux / MacOS Step 1 获取 leaderboard 代码仓库: ...

  7. 《预训练周刊》第9期:TABBIE:表格数据的预训练表示、「视觉预训练神作」:不用图片却训出图像识别SOTA?...

    No.09 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第9期< ...

  8. CVPR 2022 | CNN自监督预训练新SOTA:上交、Mila、字节联合提出具有层级结构的图像表征自学习新框架...

    ©作者 | 机器之心编辑部 来源 | 机器之心 来自上海交通大学.Mila 魁北克人工智能研究所以及字节跳动的研究者提出了一种具有层级语义结构的自监督表征学习框架,在 ImageNet 数据集上预训练 ...

  9. 超越ImageNet预训练,Meta AI提出SplitMask,小数据集也能自监督预训练

    ©作者 | 陈萍 来源 | 机器之心 大规模数据集对自监督预训练是必要的吗?Meta AI 认为,小数据集也能自监督预训练,效果还不错. 目前,计算机视觉神经网络被大量参数化:它们通常有数千万或数亿个 ...

最新文章

  1. Crontab运行php脚本
  2. java byte xml_Java XMLInputSource.setByteStream方法代码示例
  3. 机器视觉从发展到成熟,最新技术又有些什么?
  4. *58.作业与进程的关系
  5. 深度学习(17)TensorFlow高阶操作六: 高阶OP
  6. Java之ThreadPoolExcutor和四种常见的线程池
  7. Activity的缓存方法
  8. mysql查看系统可用字符集_MySQL查看所有可用的字符集
  9. python list sort by,python中List的sort方法指南
  10. BIOS中的分区工具
  11. CTF 湖湘杯 2018 WriteUp (部分)
  12. Java开发微信支付实践
  13. arduino继电器控制风扇_Arduino 笔记 - Lab21 使用继电器控制12V风扇
  14. CENTOS6 安装配置 pptpd 心得
  15. dell计算机在桌面不显示,你好,在吗?我的戴尔笔记本电脑桌面图标不显示为什么?...
  16. 零基础入门金融风控-贷款违约预测
  17. 【100%通过率】华为OD机试真题 Python 实现【整理扑克牌】【2022.11 Q4 新题】
  18. 冰与火之歌-五王之战(优达数据分析进阶项目)
  19. 基于SpringBOOT的订餐系统
  20. zabbix-agent报active check configuration update from[] started to fail(timeout)【2】

热门文章

  1. GenerationTarget encountered exception accepting command :Error executing DDL via JDBC Statement
  2. RemoteView的使用
  3. c语言矩阵键盘实验心得,DSP-矩阵键盘扫描实验.doc
  4. 关于CVRP问题的研究
  5. 生成对抗网络(九)----------ACGAN
  6. 前端面试题 —— 浏览器原理(一)
  7. UVA 12086 (树状数组)
  8. Sobel(索贝尔),Scharr(沙尔)和Laplacian(拉普拉斯)算子——python实现
  9. Spock代码讲解 - mock第三方依赖、if else 分支测试
  10. 希望你能遇到我,在我最**的时刻