本篇博客主要参考/节选中科院自动化所王唯康博士的博士论文《任务型对话系统中对话管理方法研究》。

文章目录

  • 1. 对话系统分类
  • 2. 现有对话管理方法的不足
  • 3. 参考文献

1. 对话系统分类

  • 设计目的

根据设计目的的不同,人机对话系统可以划分为三类:聊天机器人(chat bots)/闲聊型对话系统(微软小冰等)、问答系统(question and answering systems)和任务型对话系统(task-oriented dialogue systems,阿里小蜜等)。

聊天机器人的设计目的是尽可能让用户同系统进行更多轮的交互。在聊天过程中,用户没有任何明确的目的,系统起到的是情感陪护和娱乐的作用。因此,系统的趣味性和娱乐性较为重要。

问答系统的设计目的是回答用户关于事实性问题的提问,相关研究有基于知识图谱的问答(Question Answering over Knowledge Base,KBQA)[1,2]、机器阅读理解(Machine Reading Comprehension,MRC)/文本问答[3,4]、社区问答(Community based Question and Answering,CQA)[5,6]以及表格问答等领域密切相关。

任务型对话系统的设计目的是协助用户完成某一特定的任务(例如订餐、订飞机票等)。由于任务型对话系统采用对话的方式完成任务,因此这种完成任务的方式更加自然。尤其是在驾驶过程中,任务型对话系统可以解放司机的双手,使行车更为安全。 另外,在客服场景下,使用任务型对话系统替代人工客服能够为企业节省大量成本。因此,任务型对话系统的研究具有极其重大的现实意义。

  • 结构

任务型对话系统从结构上可以划分为三个模块:语言理解模块(Language Understanding,LU)、对话管理模块(Dialogue Manager,DM)和语言生成模块(Language Generation,LG)。其中,对话管理模块由对话状态追踪模块(Dialogue State Tracking,DST)和对话策略模块(Dialogue Policy,DP)组成,是任务型对话系统的中枢。

在早期的研究中,研究人员会分别实现这几个模块,然后把前一 个模块的输出作为后一个模块的输入,最后把语言生成模块的结果返回给用户。 这种方法被称为基于管道(pipeline)的方法。

这种方法直接学习对话上下文到 系统回复的映射关系,不需要单独设计各个子模块,避免了管道方法所带来的错误传递问题(error propagations),因此成为了学术界中设计任务型对话系统的主 流方法。

2. 现有对话管理方法的不足

虽然和任务型对话系统相关的研究取得了不错的进展,但是目前商用任务型对话系统依然严重地依赖规则的方法实现。其主要原因是现有对话管理方法存在如下几点不足:

  • 可维护性差
    设计任务型对话系统的第一步是预定义用户在系统中可以做什么样的操作,即用户的合法行为/动作。系统上线后,如果真实用户的某些行为没有被考虑到,系统则会给出不合理的回复。这个时候,开发者需要扩展原始对话管理模块,使得扩展后的模型能够处理新的用户行为。然而,扩展对话管理模块的成本很高。(可扩展性差)

  • 缺乏在线学习能力
    训练端到端的任务型对话系统时,开发者需要收集相应 任务下的对话数据。但是,语料的收集往往是存在偏差的。也就是说,收集到的语料不可能把某一任务下所有的对话场景全都囊括进去。此外,对话系统所需处理的用户需求可能会随着业务的变化而变化。然而,已有的任务型对话系统在部署后无法继续学习对话知识。因此,系统在处理没有考虑到的用户需求时会给出不合理的回复。

  • 缺乏知识利用的能力
    已有的对话管理方法主要关注订餐等较为简单的槽填充任务。解决这类任务时并不涉及知识的推理与利用。然而在实际的应用中,存在许多对话任务要求对话管理模块根据客观知识灵活地制定交互策略。现有对话管理方法在知识利用能力上的不足无疑限制了任务型对话系统的实际应用范围。

3. 参考文献

[1] YANG M C, DUAN N, ZHOU M, et al. Joint relational embeddings for knowledge-based question answering[C]//Proceedings of the 2014 conference on empirical methods in natural language processing (EMNLP). 2014: 645-650.
[2] BAO J, DUAN N, ZHOU M, et al. Knowledge-based question answering as machine translation[C]//Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2014: 967-976.
[3] SHENY,HUANGPS,GAOJ,etal.Reasonet:Learning to stop reading in machine comprehension[C]//Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2017: 1047-1055.
[4] HUANG H Y, ZHU C, SHEN Y, et al. Fusionnet: Fusing via fully-aware attention with application to machine comprehension[J]. arXiv preprint arXiv:1711.07341, 2017.
[5] JEON J, CROFT W B, LEE J H. Finding similar questions in large question and answer archives[C]//Proceedings of the 14th ACM international conference on Information and knowledge management. 2005: 84-90.
[6] XUE X, JEON J, CROFT W B. Retrieval models for question and answer archives[C]//Proceedings of the 31st annual international ACM SIGIR conference on Research and development in information retrieval. 2008: 475-482.

对话系统 | (7) 对话系统简介相关推荐

  1. 对话系统 | (2) 对话系统之用户模拟器

    原文地址 作者丨唐呈光.戴音培.李永彬.孙健 单位丨阿里巴巴智能服务事业部小蜜北京团队 文章目录 1. 用户模拟器基础 用户模拟器产生背景 用户模拟器的基本结构 2. 用户模拟器的实现方法 基于规则的 ...

  2. python ai对话系统_对话系统

    最近对 Rasa 产生了浓厚的兴趣,准备用Rasa打磨一下聊天机器人,所以做了一些调研和学习,准备记录一下,这是第一篇,感兴趣的同学可以参考. Rasa是一套开源机器学习框架,用于构建基于上下文的AI ...

  3. 详解预训练模型、信息抽取、文本生成、知识图谱、对话系统技术

    我们正处在信息爆炸的时代.面对每天铺天盖地的网络资源和论文.很多时候我们面临的问题并不是缺资源,而是找准资源并高效学习.其次,即便网络上的资源非常多,学习是需要成本的,而且越有深度的内容越难找到好的学 ...

  4. 关于NLP相关技术全部在这里:预训练模型、信息抽取、文本生成、知识图谱、对话系统...

    我们正处在信息爆炸的时代.面对每天铺天盖地的网络资源和论文.很多时候我们面临的问题并不是缺资源,而是找准资源并高效学习.其次,即便网络上的资源非常多,学习是需要成本的,而且越有深度的内容越难找到好的学 ...

  5. 直播预告:SIGDIAL2020最佳论文一作高信龙一评测任务导向型对话系统|AI TIME PHD对话系统专题-1...

    AI TIME PhD 对话系统专题-1 <任务导向型对话系统评测> 2020年7月10日 19:30-20:30 小爱同学/天猫精灵,放首歌. 送你一首好听的歌<XXX> 我 ...

  6. 人一样自然流畅地说话,下一代智能对话系统还有多长的路要走?

    为了推动 AI 技术的应用创新,促进人工智能领域的学术交流.人才培养,打造人工智能的人才交流平台与产业生态圈,中国人工智能学会联合杭州市余杭区人民政府联合发起了首届全球人工智能技术创新大赛,并得到了阿 ...

  7. 最新综述:对话系统之用户模拟器

    作者丨唐呈光.戴音培.李永彬.孙健单位丨阿里巴巴智能服务事业部小蜜北京团队 用户模拟器基础 用户模拟器产生背景 近几年来,强化学习在任务导向型对话系统中得到了广泛的应用,对话系统通常被统计建模成为一个 ...

  8. 像人一样自然流畅地说话,下一代智能对话系统还有多长的路要走?

    来源:机器之心 机器之心编辑部 作为人工智能的一个子领域,自然语言处理(NLP)指的是机器理解并解释人类书面语和口语的能力,目的在于使计算机像人类一样智能地理解语言和用语言表达,弥补人类交流(自然语言 ...

  9. 深入浅出对话系统——概述

    对话系统分类 按应用领域分类 任务导向对话系统 闲聊对话系统 按回复生成方式分类 检索式对话系统 生成式对话系统 检索式+生成式对话系统 任务导向对话系统 任务导向对话系统一般流程如上. 因为像Sir ...

最新文章

  1. BRCM5.02编译十:cmake: command not found
  2. Redis免费客户端 Another Redis DeskTop Manager 下载地址及安装教程
  3. log4net在WinForm和ASP.net下的设置
  4. 「长文」2022年企业数字化转型的八大趋势
  5. Sharing A Powerful Tool For Calculate Code Lines
  6. 海量数据挖掘MMDS week3:社交网络之社区检测:高级技巧
  7. MoveIt简单编程
  8. IntelliJ IDEA Maven配置 MAC系统
  9. oracle mrp mps mds 的table关联,ORACLE中的计划-Forecast/MDS/MPS/MRP(转)
  10. centos7安装禅道
  11. php 正则 问号,正则表达式的问号需要怎样使用
  12. html音乐跳动的线,利用CSS3制作跳动音乐频谱跳动效果
  13. 哔哩哔哩(B 站)刚刚崩了
  14. 图片文字识别OCR调研-中文
  15. WMS系统数据库表设计
  16. 基于北向资金指数择时策略验证与思考
  17. 让所有网站都支持深色主题 - Dark Reader
  18. 今天教你用 Python 爬取网站的指南
  19. 对空间中6个点两两连线,用红黄两种颜色对这些边染色,则同色的三角形至少有几个?
  20. 计算机怎么调节音乐模式,电脑音频管理器怎么设置,教你电脑音频管理器怎么设置...

热门文章

  1. debian9.6解决firefox浏览器安全权限的问题
  2. deeplink链接怎么生成?
  3. 智能家居新专利让你的家拥有“嗅觉”
  4. uwsgi+nginx原理介绍
  5. 解决pyCharm界面的中文显示乱码的问题
  6. 实习项目(APP线上活动页面)
  7. “解放号”大讲堂直播第十一期:Socket编程知识解析
  8. html input怎么限制字数,搞了个输入框限制字数
  9. 2年Android7K,2月Android手机性能榜:神机K40冲榜功成 天玑820力压麒麟中端芯
  10. Kubernetes 使用 PVC 持久卷后,持久卷内数据丢失问题