语音识别自半个世纪前诞生以来,一直处于不温不火的状态,直到 2009 年深度学习技术的长足发展才使得语音识别的精度大大提高,虽然还无法进行无限制领域、无限制人群的应用,但也在大多数场景中提供了一种便利高效的沟通方式。

语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

语音识别按任务难度分为面向人机对话的语音听写和面向人人对话的语音转写。得益于上述深度学习技术的不断突破,语音听写技术已广泛在语音输入、语音搜索、语音助手等产品中得到应用并日臻成熟。但是,在语音识别的行业应用中,更多的是面向人人对话的场景,例如在会议、采访、授课等场景下,语音识别将面临说话风格、口音、录音质量等诸多方面的挑战。同时,由于人人对话语言的无组织性,即使在语音识别正确率非常高的情况下,语音识别文本的可阅读性仍然存在较大的问题,需要对口语化文本进行分句、分段及流利性做后处理工作,才具有可阅读性。

语音是人类沟通和文化传承的基础。近年来,语音识别的行业应用发展为从业者描绘了一个美好的蓝图,中国仍然需要根据语音识别技术的演进规律加大研发力度,培养人才,拓展市场,继续引领语音识别的行业应用,成为语音识别技术的全球领跑者。

语音识别技术的发展,未来有哪些值得期待?相关推荐

  1. 语音识别技术的发展及难点分析

    语音识别技术的发展 与机器进行语音交流,让它听明白你在说什么.语音识别技术将人类这一曾经的梦想变成了现实.语音识别就好比"机器的听觉系统",该技术让机器通过识别和理解,把语音信号转 ...

  2. 第五十期:详解语音识别技术的发展

    在我们的生活中交流起着重要的作用.人类从符号开始,然后发展到用语言交流,再后来出现了计算和通信技术.在某些情况下,机器不仅与人类交流,也与机器之间交流.计算机和通信技术创造了互联网世界,正如我们所知的 ...

  3. 语音识别技术迎风发展,未来五年规模将近300亿

    如今,随着科学技术的发展,人工智能行业快速崛起,成为各行各业转变的关键因素.作为其代表技术之一,语音识别也因此迎来火爆.所谓语音识别,即一种机器或程序通过接收声音,分析理解声音,并因此做出相关反应的技 ...

  4. 语音识别技术的发展历程,语音识别是如何工作的?语音识别资料概述

    你一定不会怀疑自己电脑的麦克风正背着你偷偷摸摸做些什么,因为你已经很久没有用过它了. 但事实真的是这样吗? 难道谷歌真的在"监听"用户吗? 挨君想告诉你,这基本没 可 能. 谷歌浏 ...

  5. 未来纳米技术的计算机发展领域,纳米技术飞速发展 未来10年超级计算机只手掌大小...

    CNET科技资讯网10月29日国际报道一位纳米研究人员表示,小到足以放到手掌上的超级计算机将于未来10-15年问世. 爱丁堡大学工程电子学院教授迈克尔表示,如果技术仍然按过去数十年的速度发展,这一时间 ...

  6. 当下流行的语音识别技术是不是发展错了方向?

    谢谢邀请. 我对楼主 问题的理解是『使用语音识别方法进行一般的声音识别或者理解语音内容』, 这涉及到人类的语音识别.一般的『声音事件』的识别(也许我的用词不够准确).以及对语音和声音事件的认知.我觉得 ...

  7. 专家视角 | 龚健雅院士:当“传统”遥感遇上AI, 未来产业应用值得期待

    新一轮科技革命和产业变革的大幕早已掀开.作为全球科技竞争的制高点,人工智能已经成为世界主要国家推动科技跨越式发展.实现产业优化升级.赢得全球竞争主动权的关键抓手.在我国,人工智能更是上升到国家战略. ...

  8. 语音识别技术的研究难点以及未来发展方向

    (文章来源:钛媒体) 目前,语音识别研究工作进展缓慢,困难具体表现在: (1)输入无法标准统一,比如各地方言的差异,每个人独有的发音习惯等,如下图所示,口腔中元音随着舌头部位的不同可以发出多种音调,如 ...

  9. 浅析语音识别技术的工作原理及发展

    浅析语音识别技术的工作原理及发展 语音是人类最自然的交互方式.计算机发明之后,让机器能够"听懂"人类的语言,理解语言中的内在含义,并能做出正确的回答就成为了人们追求的目标.我们都希 ...

最新文章

  1. python 二叉树中所有距离为k的节点_leetcode 二叉树中所有距离为 K 的结点
  2. 由Linux内核bug引起SSH登录缓慢问题的排查与解决
  3. 推荐一本书给大家《不懂带人 你就自己做到死》
  4. Nginx配置Basic Auth登录认证的实现方法
  5. Ubuntu ORTP 编译及安装
  6. STM32L0开发——ADC多通道采集,IDE和IAR开发注意事项
  7. 代码段编辑器SnippetEditor 2.1
  8. CentOS7在/etc/grub2.conf引导中配置1G大页内存
  9. 巧用“搜索”解决自学编程遇到的难题
  10. native2ascii命令用法详解
  11. NSGA2 算法MATLAB完整代码 中文注释详解
  12. 金融交易学——一个专业交易者…
  13. Prism4学习笔记(六):UI Composition
  14. 【C#进阶3-7】C# Socket通讯
  15. 参与修谱工作,要具备哪些能力?光会修谱可不行
  16. source insight的使用
  17. SCA声明办理 TSCA限用物质检测 TSCA有毒物质控制法案检测
  18. 美国股市何时使用计算机,2020年股票交易何时开始?香港股市交易时间(图形)...
  19. 表单写年龄选择html,表 单 / HTML
  20. Win10的Wifi图标变成了小地球(WLAN被禁用)

热门文章

  1. 【首席信息官】首席信息官如何应对重大辞职
  2. 依靠Windows Defender|LockBit勒索软件通过Microsoft安全工具侧面加载Cobalt Strike
  3. 【数据结构】八大排序算法
  4. hadoop 命令合集
  5. wps表格里面的内容上下居中不了
  6. 2020-05-29 nlp_01之停用词过滤、stemming
  7. 浅析ios为什么比安卓流畅的因素
  8. Android MTK 锁屏时间显示显示不全修改
  9. 二叉树中序遍历习题引发的时间空间复杂度思考:内存角度
  10. 【矩阵论笔记】线性变换的特征值和特征向量(几何重数和代数重数)