语音对于人机交互的重要性毋庸置疑,让机器“听懂”人类语言,是语音识别技术自诞生起,就致力于实现的目标。

英语是世界通用语言,国内外企业都在英语语音识别的速度、准确度等方面持续创新。然而,AI似乎在口音英语识别上显得有些“力不从心”。

AI在口音英语识别上遇到了挑战

《华盛顿邮报》曾与Globalme、Pulse Labs两家语言研究公司合作,研究智能音箱的口音识别问题,结果显示,谷歌智能音箱Google Home更容易“听懂”美国西岸口音,对南部口音的识别准确率则要低3%;而亚马逊Echo搭载的语音助手Alexa,识别东岸口音的准确率要比中西部口音高2%。

更大的问题还在于对非本土口音的识别。研究显示,对于非英语母语者,比如以西班牙语或汉语作为第一语言的人所说的英文,不论是Google Home还是Amazon Echo,其识别准确率都要比美国本土口音低30%。

解决英语口音识别问题,已成为智能语音识别的竞争焦点,各大知名AI企业都在试图攻克这道“难题”。

例如,国内知名AI企业科大讯飞持续在口音英语识别领域发力,推出讯飞翻译机3.0。这款翻译机可识别出多地外语口音,即使遇到“不地道”的外国话,也能听得清、听得懂,帮助人们出国时不会因为语言不通造成不必要的麻烦。

讯飞翻译机3.0可识别出多地外语口音

口音英语识别到底难在哪儿?从理论上来说,只要有足够的数据供机器进行训练,那么让AI识别任何一种语言或口音,都不是问题。

也就是说,一个出色的语音识别模型,需要有大量标注数据的训练:首先,要进行语音内容的采集;其次,需要人工对这些语音进行标注,将语音内容转写成文本;最后,算法再将识别后的文本内容与对应的音频进行逻辑关联。

但百度智能云数据众包项目专家曹静文曾表示:“对于方言、口音的识别来说,最难的部分是在于语音数据的采集。”

口音英语数据是关键,但数据的采集有一定困难

数据堂作为全球领先的人工智能数据服务提供商,依托自身的数据资源、技术优势和丰富的数据处理经验,攻克语音数据采集困难,自2011年成立以来,已经为国内外1000多家人工智能企业和科研机构提供了优质的数据服务。

在口音英语数据产品方面,数据堂作为联合主办单位之一成功举办了“INTERSPEECH2020口音英语语音识别挑战赛”,并为参赛者提供了采集自8个国家的高质量的口音英语数据,数据堂设计研发的各国口音英语数据已经获得业界的一致认可。

数据堂的口音英语数据产品做到了从市场实际应用场景出发,覆盖不同场景下发音内容的多样性,从而达到训练数据与实际应用场景中的数据高度匹配,帮助客户快速提升语音识别的性能。

AI企业和科研机构在接下来的研究中应注意到以下两点:

首先,提升语言识别的准确率,需要对该语言的文化、语素、音素等有相当的研究。若要实现方言、口音的准确识别,也需要方言学者、音韵学者等专业人士的深度参与。

另外,面对一些资源相对稀缺的口音和方言时,要注重研究如何使用迁移学习,以较少数据量得到一个好的声学模型。

构建口音英语识别数据,一招化解人机口音交流相关推荐

  1. 口音英语识别能力评测,你的AI升级了吗?

    据国外媒体报道,Vocalize.ai的实验室曾经对亚马逊的语音助手Alexa.苹果的语音助手Siri和谷歌的语音助手Google Assistant进行了一项语音识别能力测试.研究人员分别使用美国. ...

  2. python构造自定义数据包_构建自定义人脸识别数据集的三种训练方法

    在接下来的几篇文章中,我们将训练计算机视觉+深度学习模型来进行面部识别.在此之前,我们首先需要收集脸部数据集. 如果你已经在使用预先准备好的数据集,比如Labeled Faces in the Wil ...

  3. 如何在时间紧迫情况下进行机器学习:构建标记的新闻 数据 库 开发 标记 网站 阅读1629 原文:How we built Tagger News: machine learning on a

    如何在时间紧迫情况下进行机器学习:构建标记的新闻 数据 库 开发 标记 网站 阅读1629  原文:How we built Tagger News: machine learning on a ti ...

  4. “抗疫”新战术:世卫组织联合IBM、甲骨文、微软构建了一个开放数据的区块链项目!...

    作者 | Rohit Chatter jee 译者 | 天道酬勤 责编 | 徐威龙 出品 | 区块链大本营(blockchain_camp) 如今,新冠肺炎是每个人心中最重要的话题.浏览我们的社交媒体 ...

  5. 【实战】深度学习构建人脸面部表情识别系统

    实战:深度学习构建人脸面部表情识别系统 一.表情数据集 数据集采用了kaggle面部表情识竞赛的人脸表情识别数据集. https://www.kaggle.com/c/challenges-in-re ...

  6. 智能驾驶 车牌检测和识别(三)《CRNN和LPRNet实现车牌识别(含车牌识别数据集和训练代码)》

    智能驾驶 车牌检测和识别(三)<CRNN和LPRNet实现车牌识别(含车牌识别数据集和训练代码)> 目录 智能驾驶 车牌检测和识别(三)<CRNN和LPRNet实现车牌识别(含车牌识 ...

  7. 【小样本实体识别】Few-NERD——基于N-way K-shot的实体识别数据集和方法介绍

    [小样本实体识别]Few-NERD--基于N-way K-shot的实体识别数据集和方法介绍 前记:   实体识别是信息抽取领域中比较重要的任务,其在学术界和工业界都是有很广泛的应用前景.但是当前实体 ...

  8. 构建自动车牌识别系统

    本文介绍了如何从零开始开发车牌对象检测模型.整体项目中还包含了一个使用Flask的API.在本文中我们将解释如何从头开始训练自定义对象检测模型. 项目架构 现在,让我们看看我们要构建的车牌识别和OCR ...

  9. 2020首届数字四川创新大赛_诈骗电话识别数据统计分析(一)

    1.竞赛背景 近年来,通过拨打电话.群发短信实施诈骗的违法行为一直困扰着手机用户,给移动手机用户造成了困扰甚至金钱的损失,如何有效防护诈骗电话对用户隐私.财产造成的威胁,成为公安急需解决的问题,也是四 ...

最新文章

  1. 最全芯片产业报告出炉,计算、存储、模拟IC一文扫尽
  2. 2.微服务间调用ribbon
  3. Java URL传参中文乱码问题
  4. 云炬Qtpy5开发与实战笔记 0搭建开发环境(傻瓜式安装)
  5. 【资源】媲美搜索神器everything,超过1秒出结果算我输!
  6. httpclient4 中文版帮助文档,最新官方版翻译版(第一章 上)
  7. Windows Server 2012 DHCP 服务器中的新功能:故障转移和策略
  8. C++中继承与虚函数示例
  9. 通过Server 2019中的组策略部署桌面墙纸 详解组策略环回处理
  10. GNU make使用(二)
  11. 并发执行linux命令结果混乱,Shell脚本--并发执行
  12. 设计模式之生成器模式
  13. (转)这张照片告诉了你蚂蚁金服成功的秘密...
  14. Vue开发环境搭建,Vue.js安装,浏览器辅助工具Vue-devtools
  15. 深度学习(16) GAN(4)
  16. python开发注册机_用python 写 Atlantis Word Processor 注册机
  17. 并行计算 Blog 02 —— SLIC代码的计算热点分析
  18. 人机对话_javaweb_ 一对一聊天系统
  19. 输入一无符号整数,求所有数位上数字之和
  20. 巨星陨落!哈尔滨工业大学讣告

热门文章

  1. Opencv根据USB摄像头PID\VID号,获取对应摄像头索引
  2. java基本微信小程序的琴房预约管理系统 uniapp 小程序
  3. 贸易大时代:代理IP助力企业出海
  4. 如何查询电脑系统和服务器地址,如何查询电脑系统和服务器地址
  5. PowerManagerService分析-updatePowerStateLocked方法
  6. 推荐一款超快的Android模拟器
  7. ipad/iphone内存管理二
  8. Java 确定线程池中工作线程数的大小
  9. 微信小程序标签页组件
  10. telegram机器人开发3-最简单的代码