机器学习和自然语言处理技术的进步为语音与人工智能的交互提供了可能。人们可以通过对话获得信息,并与机器互动,而机器将不再只存在于科幻小说中。语音交互是未来的发展方向。智能扬声器是语音交互着陆的第一代产品。

以市面上面流行的智能电话机器人为例,他的AI模块主要包含了4部分自动语音识别(Automatic Speech Recognition, ASR),自然语言理解(Natural Language Understanding, NLU)
,自然语言生成(Natural Language Generation, NLG),文字转语音(Text to Speech, TTS)


以欧能智能机器人中的语音交互流程图为例子,来看看Ai智能机器人对话技术的主要路径:

在上图我们可以看到,用户使用的时候是与设备进行交互完成的,并且主要是采用语音的处理方式。

要想完整完整的完成语音交互,必须要弄懂流程,这是一款电话机器人好不好用的关键,一次成功的语音交互流程,主要涉及以下4个阶段,且环环相扣。

意图
表示用户在使用应用时所做的动作(譬如:问一个问题或发送一条指令),这些意图代表了应用的核心功能。如果应用成功地识别了用户意图,则需要在完成业务动作后,将结果反馈给用户。

识别意图—语义解析
对语音识别结果进行分析理解,简单来说就是将用户语音输入映射到机器指令。它可能定义了一组包含指定的单词或短语的语法结构,用户通过说出满足这种结构的语句,来调用意图。

处理意图—云端交互
调用意图的结构化请求,向服务器请求处理后做出反馈响应。 通俗来讲该流程主要处理用户的请求,解决用户问题的答案。

语言合成模块 – 组织语言
根据解析模块得到的内部表示,在对话管理机制的作用下生成自然语言句子。 同时将生成模块生成的句子转换成语音输出。(把回答的机器语言再转换成 口语语言)

整个流程虽然看起来较为简单,但是中间的自然语言处理的关键技术是必须要掌握的。

词法分析
词汇分析包含形态和词汇。一般来说,形态素主要反映在单词的前缀和后缀的分析上,词汇反映在整个词汇体系的控制上。在中文全文检索系统中,在中文信息、即中文自动单词分割技术的单词分割中,词汇分析主要出现。利用该技术,能够正确解析用户输入信息的特性,完成正确的搜索过程。是中文全文检索技术的重要发展方向。

句法分析
句法分析是对用户输入的自然语言进行词汇短语的分析,目的是识别句子的句法结构,实现自动句法分析过程。其基本方法有线图分析法、短语结构分析、完全句法分析、局部句法分析、依存句法分析等。

语义分析
语义分析是基于自然语言语义信息的一种分析方法,其不仅仅是词法分析和句法分析这样语法水平上的分析,而是涉及到了单词、词组、句子、段落所包含的意义。其目的是从句子的语义结构表示言语的结构。中文语义分析方法是基于语义网络的一种分析方法。语义网络则是一种结构化的,灵活、明确、简洁的表达方式。

语用分析
语用分析相对于语义分析又增加了对上下文、语言背景、环境等的分析,从文章的结构中提取到意象、人际关系等的附加信息,是一种更高级的语言学分析。它将语句中的内容与现实生活的细节相关联,从而形成动态的表意结构。

语境分析
语境分析主要是指对原查询语篇以外的大量“空隙”进行分析从而更为正确地解释所要查询语言的技术。这些“空隙”包括一般的知识,特定领域的知识以及查询用户的需要等。它将自然语言与客观的物理世界和主观的心理世界联系起来,补充完善了词法、语义、语用分析的不足。

智能电话机器人对话目前存在的问题
在人与机器的会话过程中,用户必然会犯表达错误,导致用户语言机械理解的偏离。此时,错误修正机构对于机器来说非常重要。如果这个机制不能利用,用户显然需要花费很长时间来说明他们的意图,并且对应的用户经验非常坏吧。另一方面,能够很好地认识语音,但是不能理解对话的目的,有理解意义的偏颇。因此,语音对话中应解决的问题是模糊消除和未知语言现象的处理。

智能语音助手背后的生态服务
一个好的智能电话机器人要想落地开花,它不仅仅是简单的语音识别那么简单,还有集成服务,一整套的中文生态、内容、服务等配套设施,是一种涵盖很多基础能力的生态系统。
未来基于语音交互的语义技能,必须要能够达到几万、几十万甚至上百万种的时候,才能促使语音交互时代操作系统真正走向成熟,未来语音交互产品的形态和样式也将越来越丰富。

简单剖析智能语音交互技术相关推荐

  1. 【线上直播】ICASSP论文解读 | 智能语音交互技术

    随着人工智能高速发展,智能语音交互技术正在被国内外巨头公司逐步落地和规模化应用. 5月21日 19:30-20:30,LiveVideoStack联合滴滴语音团队,邀请滴滴AI Labs三位技术专家对 ...

  2. 智能语音交互技术在360的落地实践

    作者:龚小春,来自:DataFun 导读:随着语音交互技术的发展,对话系统已经越来越成熟.对话系统的最新进展绝大多数是由深度学习技术所贡献的,深度学习技术可以通过利用大规模数据来学习有意义的特征表示和 ...

  3. 【人工智能】智能语音交互技术与应用

    智能语音交互(Intelligent Speech Interaction),是基于语音识别.语音合成.自然语言理解等技术,为企业在多种实际应用场景下,赋予产品"能听.会说.懂你" ...

  4. 人工智能智能语音交互技术与应用

    人工智能(Artificial Intelligence),英文缩写为AI.它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的一门新的技术科学. 人工智能是计算机科学的一个分支, ...

  5. 简单剖析智能指针的思想

    谈到智能指针之前,必须要知道堆栈的相关思想,堆栈在程序开发过程中经常使用到的.比如应用程序的函数当中通过new一个对象,这个对象的实际存储地方是在堆上,而它的指针是保存在栈,在函数执行完毕之后,该对象 ...

  6. 中国智能语音行业研究

    报告来源:中信证券 作者:刘雯蜀  杨泽原  张若海 智能语音作为人机交互的新型方式,有望大规模推广,中国市场是更适合语音交互的市场. 2017年中国人工智能市场规模达约220亿元,智能语音占中国人工 ...

  7. AnyPi智能语音交互方案开发-智能语音音箱方案

    智能语音交互解决方案 AnyPi 提供基于Amazon Alexa/DuerOS/科大讯飞等语音平台的接入服务 语音对话: 使设备具有"能听能说"的能力,人与设备通过语音对话就可实 ...

  8. AnyPi智能语音音箱方案 智能蓝牙WIFI音箱方案开发 DuerOS及Alexa平台

    AnyPi 是由深圳奥卓领航有限公司推出的一款智能语音交互解决方案(官网:https://anypi.com),具有强大开发能力的团队,所有硬件,软件均具有自主研发知识产权.AnyPi团队从2014年 ...

  9. 智能语音技术:从哪儿来?往何处去?

    近几年,语音识别技术逐渐走向成熟,越来越多的互联网公司及硬件厂商在布局智能语音的商业版图.万物互联的浪潮势不可挡,智能语音技术在汽车.智能家居.教育等各个领域全面开花. 智能语音从何发展至今?当前面临 ...

最新文章

  1. 36.迷宫(广度优先搜索)
  2. 攻防世界 Web进阶(一)
  3. crt脚本 js 在_crt脚本 js 在_使用SecureCRT自带的脚本录制功能。
  4. spring学习(13):使用junit4进行单元测试续
  5. mac启动mysql,apache,php
  6. STM32----摸石头过河系列(六)
  7. 基于深度学习的图像修补/完整方法分析
  8. 99乘法表 (输入一个数,以该数为行数输出乘法表)
  9. 学 shell (1/5)
  10. python编程软件哪个好-python IDE有哪些?哪个好用?
  11. Android SDK 下载安装及配置
  12. Charles中文破解版下载安装及使用教程(附带免费下载链接)
  13. 导热电池粘合剂市场现状及未来发展趋势
  14. C语言 身份证号解析年龄和性别
  15. 报错:TypeError: Image data of dtype object cannot be converted to float
  16. 常用html5阅览器,最好的网页浏览器排行,速度最快的四大浏览器分享
  17. 在群晖NAS上搭建导航页_通过Web Station搭建
  18. 运动品牌的“变脸”速度,跟得上用户的“喜新厌旧”吗?
  19. 抽象代数 04.05 群的直积
  20. 【DockerCE】Docker-CE 23.0.2正式版发布

热门文章

  1. 戴尔塔式服务器显示器掉帧,简单记录我如何解决的笔记本外接显示器游戏掉帧问题...
  2. [干货分享]1000篇干货好文!量子技术——资讯篇
  3. 心肝脾肺肾的功能_我是亲民_新浪博客
  4. 搞笑“修勾”在线修沟,魔性配音不绝于耳,这种短视频如何制作
  5. Java知识体系最强总结(2020版) 传送门
  6. 数据库:连接join的使用
  7. 16.4.1. configure Options
  8. Springboot+netty网络聊天
  9. 台式计算机蓝屏代码08e,Windows8.1开机蓝屏提示蓝屏代码0x000008e怎么修复?
  10. Python的函数drop_duplicates参数说明