构建口音英语识别数据,一招化解人机口音交流
语音对于人机交互的重要性毋庸置疑,让机器“听懂”人类语言,是语音识别技术自诞生起,就致力于实现的目标。
英语是世界通用语言,国内外企业都在英语语音识别的速度、准确度等方面持续创新。然而,AI似乎在口音英语识别上显得有些“力不从心”。
AI在口音英语识别上遇到了挑战
《华盛顿邮报》曾与Globalme、Pulse Labs两家语言研究公司合作,研究智能音箱的口音识别问题,结果显示,谷歌智能音箱Google Home更容易“听懂”美国西岸口音,对南部口音的识别准确率则要低3%;而亚马逊Echo搭载的语音助手Alexa,识别东岸口音的准确率要比中西部口音高2%。
更大的问题还在于对非本土口音的识别。研究显示,对于非英语母语者,比如以西班牙语或汉语作为第一语言的人所说的英文,不论是Google Home还是Amazon Echo,其识别准确率都要比美国本土口音低30%。
解决英语口音识别问题,已成为智能语音识别的竞争焦点,各大知名AI企业都在试图攻克这道“难题”。
例如,国内知名AI企业科大讯飞持续在口音英语识别领域发力,推出讯飞翻译机3.0。这款翻译机可识别出多地外语口音,即使遇到“不地道”的外国话,也能听得清、听得懂,帮助人们出国时不会因为语言不通造成不必要的麻烦。
讯飞翻译机3.0可识别出多地外语口音
口音英语识别到底难在哪儿?从理论上来说,只要有足够的数据供机器进行训练,那么让AI识别任何一种语言或口音,都不是问题。
也就是说,一个出色的语音识别模型,需要有大量标注数据的训练:首先,要进行语音内容的采集;其次,需要人工对这些语音进行标注,将语音内容转写成文本;最后,算法再将识别后的文本内容与对应的音频进行逻辑关联。
但百度智能云数据众包项目专家曹静文曾表示:“对于方言、口音的识别来说,最难的部分是在于语音数据的采集。”
口音英语数据是关键,但数据的采集有一定困难
数据堂作为全球领先的人工智能数据服务提供商,依托自身的数据资源、技术优势和丰富的数据处理经验,攻克语音数据采集困难,自2011年成立以来,已经为国内外1000多家人工智能企业和科研机构提供了优质的数据服务。
在口音英语数据产品方面,数据堂作为联合主办单位之一成功举办了“INTERSPEECH2020口音英语语音识别挑战赛”,并为参赛者提供了采集自8个国家的高质量的口音英语数据,数据堂设计研发的各国口音英语数据已经获得业界的一致认可。
数据堂的口音英语数据产品做到了从市场实际应用场景出发,覆盖不同场景下发音内容的多样性,从而达到训练数据与实际应用场景中的数据高度匹配,帮助客户快速提升语音识别的性能。
AI企业和科研机构在接下来的研究中应注意到以下两点:
首先,提升语言识别的准确率,需要对该语言的文化、语素、音素等有相当的研究。若要实现方言、口音的准确识别,也需要方言学者、音韵学者等专业人士的深度参与。
另外,面对一些资源相对稀缺的口音和方言时,要注重研究如何使用迁移学习,以较少数据量得到一个好的声学模型。
构建口音英语识别数据,一招化解人机口音交流相关推荐
- 口音英语识别能力评测,你的AI升级了吗?
据国外媒体报道,Vocalize.ai的实验室曾经对亚马逊的语音助手Alexa.苹果的语音助手Siri和谷歌的语音助手Google Assistant进行了一项语音识别能力测试.研究人员分别使用美国. ...
- python构造自定义数据包_构建自定义人脸识别数据集的三种训练方法
在接下来的几篇文章中,我们将训练计算机视觉+深度学习模型来进行面部识别.在此之前,我们首先需要收集脸部数据集. 如果你已经在使用预先准备好的数据集,比如Labeled Faces in the Wil ...
- 如何在时间紧迫情况下进行机器学习:构建标记的新闻 数据 库 开发 标记 网站 阅读1629 原文:How we built Tagger News: machine learning on a
如何在时间紧迫情况下进行机器学习:构建标记的新闻 数据 库 开发 标记 网站 阅读1629 原文:How we built Tagger News: machine learning on a ti ...
- “抗疫”新战术:世卫组织联合IBM、甲骨文、微软构建了一个开放数据的区块链项目!...
作者 | Rohit Chatter jee 译者 | 天道酬勤 责编 | 徐威龙 出品 | 区块链大本营(blockchain_camp) 如今,新冠肺炎是每个人心中最重要的话题.浏览我们的社交媒体 ...
- 【实战】深度学习构建人脸面部表情识别系统
实战:深度学习构建人脸面部表情识别系统 一.表情数据集 数据集采用了kaggle面部表情识竞赛的人脸表情识别数据集. https://www.kaggle.com/c/challenges-in-re ...
- 智能驾驶 车牌检测和识别(三)《CRNN和LPRNet实现车牌识别(含车牌识别数据集和训练代码)》
智能驾驶 车牌检测和识别(三)<CRNN和LPRNet实现车牌识别(含车牌识别数据集和训练代码)> 目录 智能驾驶 车牌检测和识别(三)<CRNN和LPRNet实现车牌识别(含车牌识 ...
- 【小样本实体识别】Few-NERD——基于N-way K-shot的实体识别数据集和方法介绍
[小样本实体识别]Few-NERD--基于N-way K-shot的实体识别数据集和方法介绍 前记: 实体识别是信息抽取领域中比较重要的任务,其在学术界和工业界都是有很广泛的应用前景.但是当前实体 ...
- 构建自动车牌识别系统
本文介绍了如何从零开始开发车牌对象检测模型.整体项目中还包含了一个使用Flask的API.在本文中我们将解释如何从头开始训练自定义对象检测模型. 项目架构 现在,让我们看看我们要构建的车牌识别和OCR ...
- 2020首届数字四川创新大赛_诈骗电话识别数据统计分析(一)
1.竞赛背景 近年来,通过拨打电话.群发短信实施诈骗的违法行为一直困扰着手机用户,给移动手机用户造成了困扰甚至金钱的损失,如何有效防护诈骗电话对用户隐私.财产造成的威胁,成为公安急需解决的问题,也是四 ...
最新文章
- 最全芯片产业报告出炉,计算、存储、模拟IC一文扫尽
- 2.微服务间调用ribbon
- Java URL传参中文乱码问题
- 云炬Qtpy5开发与实战笔记 0搭建开发环境(傻瓜式安装)
- 【资源】媲美搜索神器everything,超过1秒出结果算我输!
- httpclient4 中文版帮助文档,最新官方版翻译版(第一章 上)
- Windows Server 2012 DHCP 服务器中的新功能:故障转移和策略
- C++中继承与虚函数示例
- 通过Server 2019中的组策略部署桌面墙纸 详解组策略环回处理
- GNU make使用(二)
- 并发执行linux命令结果混乱,Shell脚本--并发执行
- 设计模式之生成器模式
- (转)这张照片告诉了你蚂蚁金服成功的秘密...
- Vue开发环境搭建,Vue.js安装,浏览器辅助工具Vue-devtools
- 深度学习(16) GAN(4)
- python开发注册机_用python 写 Atlantis Word Processor 注册机
- 并行计算 Blog 02 —— SLIC代码的计算热点分析
- 人机对话_javaweb_ 一对一聊天系统
- 输入一无符号整数,求所有数位上数字之和
- 巨星陨落!哈尔滨工业大学讣告