MultiWOZ 2.1: A Consolidated Multi-Domain Dialogue Dataset with State Corrections and State Tracking Baselines

MultiWOZ 2.1:具有状态校正和状态跟踪基线的综合多域对话数据集

Abstract

首先抬一手MUZ2.0,虽然目前是最大的多域对话数据集,但是MUZ2.0还是存在很多问题。

第一:对话状态注释和对话话语中存在大量的噪声

第二:扩充了原始数据集的多个共存版本,不统一

所以论文提出2.1版本的数据集解决以上问题。

为了解决数据集中的噪声问题,人工的重新对对话数据集进行标注。此外,将数据集中话语的槽值规范成预定于实体中的槽值。

并包含了域槽的描述

Introduction

DST 的重要性,MUZ2.0数据集为turn级别的数据集进行对话状态的注释,但是有噪声。

论文的贡献:

一、论文中详细总结了2.0中出现的4种错误,此外更正拼写错误,和规范化实体名称。

二、2.1将最近为2.0增加的很多对话行为都总结起来,并加入了域槽的描述信息。

Dataset Corrections

MUZ2.0中的话语是Wizard-of-OZ数据集中收集的,在这个数据集中有两个工作人员一个扮演向导,一个扮演用户。为用户角色提供一个目标,让用户角色的人与基于文本的聊天界面与向导交流。在这种情况下,2.0数据集中会出现以下错误:

Dialogue State Error Types

(1)延迟注释:指应该在当前轮次注释的槽值确没有注释,而是在之后几轮处理后注释上了。

(2)槽值分开注释:话语中提到的槽值其中含有多个token,这样模型就有可能针对多个token匹配多个槽值,从而导致对话状态的性能下降

(3)注释错误:槽值填充错误

(4)槽值拼写错误:槽值注释的是正确的,但是拼写错误

(5)槽值遗忘:有些预定义的槽值一直没有出现在对话状态中

Dialogue State Corrections

论文中采用两种方法修正数据集中的错误:(1)手动修改(2)自动修改。

手动修改是要求工作人员逐个对样本进行检查并修改

其中作者发现有些对话样本钟大哥对话状态的域槽可能包含多个槽值,因此,作者将多个槽值加入进去了。2.1数据集中有超过250哥多曹植的域槽。

同时发现对话话语中存在错误的槽值,会影响对话状态的生成,作者将生成的对话状态的槽值根据后台数据库规范化。

规范化槽值之后,很多域槽中的槽值明显减少,说明作者去掉了一些重复不规范的槽值,但是针对时间方面的域槽 ,槽值增加了,因为作者扩充了时间点,以24小时制度注释。

Dialogue Utterance Corrections

作者指出,对话话语中提及的槽值的规范化正确性非常重要。即话语中的槽值有可能拼写错误、或者与预定义实体中的槽值拼写不一样。

总共修改了146个话语。

Slot Description

为了适应低资源任务的开发,可以通过学习潜在的语义表示仅使用slot描述来引导新领域。是可行的。

我们研究了两个注释器,并未每个域槽添加了至少一个自然语言描述。当在插槽名称本身不具有含义的情况下采用自然语言描述会帮助模型理解。

Dialogue act annotation

2.0中缺少用户话语行为的注释。作者对系统话语和用户话语都进行了增加

Results and Discussion

性能下降,为DST未来模型改进留下了充足改进的空间。

MultiWOZ 2.1数据集论文笔记相关推荐

  1. 论文笔记目录(ver2.0)

    1 时间序列 1.1 时间序列预测 论文名称 来源 主要内容 论文笔记:DCRNN (Diffusion Convolutional Recurrent Neural Network: Data-Dr ...

  2. RES 新的数据集 Advancing Referring Expression Segmentation Beyond Single Image 论文笔记

    RES 新的数据集 Advancing Referring Expression Segmentation Beyond Single Image 论文笔记 一.Abstract 二.引言 三.相关工 ...

  3. 【论文笔记】 LSTM-BASED DEEP LEARNING MODELS FOR NONFACTOID ANSWER SELECTION

    一.简介 这篇论文由IBM Watson发表在2016 ICLR,目前引用量92.这篇论文的研究主题是answer selection,作者在这篇论文基础上[Applying Deep Learnin ...

  4. 光流 速度_[论文笔记] FlowNet 光流估计

    [论文笔记] FlowNet: Learning Optical Flow with Convolutional Networks 说在前面 个人心得: 1. CNN的光流估计主要是速度上快,之后的v ...

  5. 论文笔记:HKMF-T: Recover From Blackouts in TaggedTime Series With Hankel Matrix Factorization

    论文笔记:Hankel Matrix Factorization for Tagged Time Series to Recover Missing Values during Blackouts_U ...

  6. 论文笔记 A Spatial-Temporal Decomposition Based Deep Neural Network for TimeSeries Forecasting

    0 abstract 空间时间序列预测问题出现在广泛的应用中,如环境和交通问题.由于存在特定的空间.短期和长期模式,以及维度的诅咒,这些问题具有挑战性. 在本文中,我们提出了一个用于大规模空间时间序列 ...

  7. 论文笔记:Autoregressive Tensor Factorizationfor Spatio-temporal Predictions

    0 摘要 张量因子tensor factorization分解方法在时空数据分析领域很受欢迎,因为它们能够处理多种类型的时空数据,处理缺失值,并提供计算效率高的参数估计程序. 然而,现有的张量因子分解 ...

  8. Deep Learning论文笔记之(八)Deep Learning最新综述

    Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...

  9. Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现

    Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 zouxy09@qq.com http://blog.csdn.net/zouxy09          自己平时看了一些论文, ...

最新文章

  1. idea从mapper接口跳到xml文件
  2. matlab绘图 excel,『在matlab上如何导入excel表格然后画图』excle表格如何使用绘图笔...
  3. 同事操作两个数据源保持事务一致_微服务分布式事务4种解决方案实战
  4. MySQL常见的库操作,表操作,数据操作集锦及一些注意事项
  5. 在没有Docker容器的Ubuntu上安装SQL Server 2019
  6. Linux下完全删除用户
  7. Centos7搭建pptp一键安装脚本
  8. 当Java遇上机密计算
  9. ITIL 4讲解:ITIL4的设计框架解析
  10. 安装VS之后,excel每次启动都会配置Visual Studio的解决办法
  11. PaddlePadlle2.3实现人脸关键点检测
  12. 华为手机相册怎么镜像翻转_手机相册里的最近删除怎么关
  13. Prisma(一):初识
  14. 你知道bat是什么意思吗?
  15. wgs84坐标格式转换度分秒_WGS84经纬度坐标转换到西安80高斯投影坐标。
  16. 跑步时戴什么耳机好、分享五款最适合跑步的运动耳机排名清单
  17. imx6ull用video4linux,CB140(imx6ull)使用Openwrt系统
  18. [A002]微擎新版本今日头条小程序
  19. RFID标签的基础知识(3)--了解芯片(之超高频标签芯片篇)
  20. 读取工程下的文档 统计重复的姓名 并按次数排序 java_java并打印出重复的姓名和重复的次数,并按重复次数排序...

热门文章

  1. HTTP协议post请求返回json数据
  2. python简单体育竞技模拟_【python】羽毛球竞技模拟
  3. 计算机网络教研室网站参考,计算机网络教研室
  4. qt画圆,QT圆的中点生成算法 ,自己设定圆心和半径,应用中点算法生成圆弧或者圆。
  5. 评测回顾 | 南大通用分布式事务型数据库产品GBase 8c
  6. 牛叔说电影-励志四部曲之死亡诗社
  7. 算法的trick_完整推导了svm一遍,还有强化学习问的很多,dqn的各种trick了...
  8. html坐标绘制路径,HTML5 CANVAS:绘制路径
  9. Pandownload关闭了,百度网盘真的提速高达10Mb/s?
  10. 安超云生态 | 安超云与百信完成产品兼容互认证 携手打造协同生态