每天给你送来NLP技术干货!


来自:复旦DISC

作者:赵刚

引言

基于情感分析的对话系统,旨在捕获用户的情感,并产生共情的回应。本次分享将介绍三篇来自 AAAI 2022 的相关论文,第一篇文章和第三篇文章均提出了共情对话生成任务的新模型,前者专注于为模型引入情感相关的知识概念,后者专注于推理用户当前状态。第二篇文章介绍了一个适用于对话情感分析任务的混合课程学习策略。仔细研读三篇论文,有助于我们对如何围绕情感做对话生成产生更深刻的理解。

文章概览

Knowledge Bridging for Empathetic Dialogue Generation

缺乏外部知识使得共情对话系统难以感知隐含隐情绪并从有限的对话历史中学习情感交互。因此,作者提出利用外部知识,包括常识知识和情感词汇知识,来明确地理解和表达情感。在共情对话生成中。首先通过与外部知识联合交互丰富对话历史,并构建情感上下文图。然后从知识丰富的情感上下文图中学习情感上下文表示并提取情感信号。最后,提出一个情绪交叉注意力机制,从情感上下文图中学习情绪的依赖关系。广泛的的实验验证了所提出方法的有效性。

Hybrid Curriculum Learning for Emotion Recognition in Conversation

对话情绪识别旨在检测每个话语的情感标签。近期的研究证明,按照一个有意义的顺序提供训练数据,而不是随机排序,可以有效地提高模型性能。作者提出了一个面向 ERC 的混合课程学习框架,框架包括两类课程,对话级课程(CC)和话语级课程(UC)。通过在 CC 层和 UC 层分别设计难度测量器和训练调度器,使各个 ERC 模型获得性能的显著提升。

CEM: Commonsense-aware Empathetic Response Generation

在共情对话生成任务上,相关工作主要集中在监测并利用用户的情感来产生共情回应。然而,由于共情包括情感和认知两个方面,作者认为除了识别用户的情绪外,还应该考虑对用户情况的认知理解。为此,作者提出了一种新的共情回应生成方法,该方法利用常识获得更多关于用户情况的信息,并利用该额外信息进一步增强共情性在生成回应中表达。

论文细节

1

动机

人们通常会依赖过往经验和外部知识来表达隐含情绪。通过对 Empathetic Dialogue 数据集的调研,作者发现回应和提问中重合词的比例非常低,这说明人们需要更多的外部知识来做出共情回应。此外,调研结果表明,情感依赖性和情感惰性常常和外部知识在共情对话中一起出现。基于以上结果,作者提出了基于外部知识的共情对话生成模型 KEMP。

外部知识

作者利用的外部知识源为 ConceptNet 和 NRC_VAD。ConceptNet 是一个用于描述自然语言中一般性人类知识的大规模知识图谱。基本单元是由头部概念,关系,尾部概念和置信度组成的四元组。NRC_VAD 是一个表示 2000 多个英文单词的三维向量的集合,每个向量有三个维度,用于表示对应单词不同方面的信息,各个维度的取值范围及含义如下表所示。

模型

模型由三个模块组成,情感上下文图,情感上下文编码器和情感依赖解码器。

情感上下文图通过将对话上下文和两类外部知识交互构建情感上下文图,对于对话历史中的每个词,在 ConceptNet 中检索最相关的若干情感相关概念,将每个概念词和查询词用边相连。此外,对话上下文中的相邻词通过边相连,上下文序列头部的 [CLS] 需要和所有其他节点通过边相连,构图完成。

情感上下文编码器融合了词编码,位置编码和图节点状态编码,对图中节点用向量表示。然后采用多头图注意力机制和全局上下文信息对节点表示进行更新。此外,模型从情感上下文图中学习情感信号来指导共情对话生成。

情感依赖编码器采用自回归的方式预测回应中的下一个词,在解码的第 j+1 部,输入是情感上下文编码器得到的情感信号向量和前 j 步预测的序列。因为对话中情感显著的信息会更大可能被捕捉到,作者设计了一个情感注意力误差来专注于那些情感强度值更高的节点。

模型采用多任务的方式进行训练,训练误差有三个部分组成 —— 情感预测误差,生成误差,情感注意力误差。情感预测误差用于衡量模型情感分析方面的性能,公式如下:

实验结果

下图是作者在 Empathetic Dialogue 数据集上进行的相关实验,评价指标分为人工评价和自动评价,自动评价指标包括 Emotion Accuracy,Perplexity,Distinct-N;人工评价指标包括 Empathy,Relevance,Fluency。实验结果表面,KEMP 模型相比于基线模型在大部分的指标上出现了很大的提升。此外,可以发现,如果没有情感建模,Transformer 只能基于语义映射生成流畅的响应,但无法表达多样化的响应。

作者关于外部知识注入量的影响进行了相关实验。结果如下图所示。当为上下文中每个词注入的情感相关概念为 10 的时候,情感分类的准确率最高,情感分析效果最好。

下图是 KEMP 和基线模型在说话者两种不同的情绪状态下生成的响应。下划线表示与知识相关的词。可以看出 KEMP 对于外部知识的利用对于响应生成有很大提升。

2

介绍

作者构建了一个基于对话中的 “情绪转移” 频率的难度测量器,然后根据返回的难度分数将对话安排在 “从易到难” 的模式中。话语级课程考虑情感相似性,逐步增强模型识别混淆情绪能力。通过提出的与模型无关的混合课程学习策略,作者实验发现各种现有 ERC 模型的性能显著提升,并且能够在四个公共 ERC 数据集上实现 SOTA。

训练框架

课程学习一般包含两个部分,难度测量器和训练调度器。难度测量器用于量化每个数据样本的相对容易程度。训练调度器根据难度测量器返回的判断,安排数据样本在整个训练过程中的顺序。文章提出的混合课程学习策略包含两类课程:对话级课程(CC)和话语级课程 (UC)。下图是混合课程学习的框架:

对话级课程

在 ERC 任务中,如何有效的解决 “情感转移” 问题是一个核心挑战。因此,在 CC 中,作者采用情感转移频率作为难度测量器,情感转移越频繁,课程难度越大。公式如下:

表示对话课程  中情绪转移的频率, 表示对话课程  中话语(utterance)的个数, 表示对话课程  中说话者(speaker)的数量,也作为平滑因子。

训练调度方式采用 baby step,将整个训练集分为若干个桶 ,桶内的数据样本的难度相似,所有桶按照从易到难的顺序排列。所有桶依次参与训练,在一轮训练结束后,下一个桶合并到当前训练集合中,在新的训练集上开始下一轮的训练。

话语级课程

在训练过程中,同一对话中的话语必须同时输入到一个批次中。因此,采用传统的训练调度器(如 baby step)来安排话语的训练顺序是不可行的。为此,作者提出了基于情感相似性的课程学习来解决这个问题。下图是作者基于之前工作提出的情绪唤醒 - 效价 (arousal-valence) 坐标,其中包含标准 ERC 数据集中的所有情绪。每个情绪标签都可以映射到单位圆上的一个点,可以借此计算情感标签之间的相似度。

首先将每个情感标签对之间的相似度按如下公式计算,并生成情感相似度矩阵 ,然后将  归一化为 。

在 ESC 训练开始时,将  的行作为所有可能的类别上初始目标概率分布,每一行代表一个情感标签。每个输入话语不仅仅属于对应的标准情感标签,也较小程度地属于相似的情感标签。随着训练的进行,这个标签表示向量会逐渐收敛到 one-hot 向量。上述更新策略如算法流程的第 9-11 行。在训练的每一步,话语  的预测概率分布定义为 。最后,模型会以标准的交叉熵损失进行训练,损失函数如下:

其中  表示在对话  中话语  的情感标签预测为  的概率, 表示第  个训练步上  的标签  的目标概率。

整个混合课程学习的训练算法流程如下:

实验结果

下图是一些 baseline 模型使用混合课程学习的对比结果,可以看出混合课程学习能使现有 ERC 模型性能显著提高。

3

动机

人类习惯于在对话中使用常识在提及的显式信息和未提及的隐含信息之间建立联系。因此,作者认为,如果对话系统也能够利用常识来从显式信息中推断隐含信息,那么将有利于更好地了解用户的情况和感受,从而带来更有效的认知上的共情力,进而产生更具共情性的回应。

模型

CEM 利用的常识知识库是 ATOMIC。具体方式是采用 COMET 进行用户情况推理,其中 COMET 是在 ATOMIC 的三元组数据上微调的 GPT-2 模型。通过 COMET,可以获得关于用户情况的不同角度的推理,包括反应推理(React),意图推理(Intent),前提推理(Need),影响推理(Effect),需求推理(Want)。模型框架如下:

上下文编码

将上下文进行拼接,然后对每个 token 用向量表示,编码方式有 token embedding,position embedding 和 speaker embedding。speaker embedding 用于区分不同的话语出自的说话者。接着将上下文矩阵输入编码器,得到上下文编码 。

知识获取

利用 COMET 获得关于用户情况的不同角度的常识推理。将反应推理结果作为情感类,其余推理结果作为认知类。对于情感类中的结果,输入编码器,再利用平均值池化,得到相应的情感向量表示 ;对于认知类中的结果,输入编码器,再提取 [CLS] 对应的向量,得到相应的认知向量表示 。情感向量会经过一个线性层和 softmax,得到情感概率分布,于是利用交叉熵得到情感预测误差 。

上下文精炼

将(2)中得到的情感向量  和认知向量  分别和(1)中的上下文表示  进行字符级上的拼接,在经过各自的编码器得到情感 - 上下文表示  和认知 - 上下文表示 。

知识选择

将情感 - 上下文表示  和认知上下文表示  相拼接得到融合上下文表示 ;对  做 sigmoid 可以得到所有推理角度的重要性,接着继续融合得到最终表示 。

回应生成

最后,利用  自回归地进行回应生成,公式如下:

实验结果

作者在 Empathetic Dialogue 数据集上进行了相关实验,发现在各个指标上都达到了 SOTA。CEM 不仅考虑了对用户情感的捕捉,而且考虑了对用户当前状态的推理,提高了模型回应的共情能力。

供稿丨 赵   刚编辑丨 赵丽敏责编丨 马若雪


供稿人:赵刚 丨研究生一年级丨研究方向:对话系统 丨邮箱:21210980095@m.fudan.edu.cn

最近文章

EMNLP 2022 和 COLING 2022,投哪个会议比较好?

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

阿里+北大 | 在梯度上做简单mask竟有如此的神奇效果


下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套!  后台回复【五件套】
下载二:南大模式识别PPT  后台回复【南大模式识别】

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易,还望给个在看!

AAAI'22 | 基于情感分析的开放域对话系统相关推荐

  1. 开放域对话系统的属性一致性识别

    论文名称:Profile Consistency Identification for Open-domain Dialogue Agents 论文作者:宋皓宇,王琰,张伟男,赵正宇,刘挺,刘晓江 原创作 ...

  2. 【工大SCIR】AAAI20 基于Goal(话题)的开放域多轮对话规划

    论文名称:Knowledge Graph Grounded Goal Planning for Open-Domain Conversation Generation 论文作者:徐俊,王海峰,牛正雨, ...

  3. Facebook开源问答系统DrQA:基于单一信源回答开放域提问

    本文来自AI新媒体量子位(QbitAI) 今天一大早,Yann LeCun就转发了一条消息:Facebook开源了DrQA的代码. DrQA是一个开放域问答系统. 关于DrQA,Facebook还发表 ...

  4. 【Paper Note】基于情感分析和关系网络的影视产品评论数据文本挖掘研究

    中国知网链接 摘要 [目的]为了挖掘观众对影视产品的主观感受,建立合适的模型评估影视产品的质量. [方法]本文通过对web影视作品评论数据建立评估模型,通过LDA和关系网络进行分析研究,并将结果与影视 ...

  5. 【毕业设计】基于情感分析的网络舆情热点分析系统

    文章目录 0 前言 1 课题背景 2 数据处理 3 文本情感分析 3.1 情感分析-词库搭建 3.2 文本情感分析实现 3.3 建立情感倾向性分析模型 4 数据可视化工具 4.1 django框架介绍 ...

  6. 去重 属性_赛尔原创@EMNLP2020|开放域对话系统的属性一致性识别

    论文名称:Profile Consistency Identification for Open-domain Dialogue Agents论文作者:宋皓宇,王琰,张伟男,赵正宇,刘挺,刘晓江原创作者: ...

  7. AAAI 2021 | 情感分析最新进展解读

    图片来源:网络 作者:陆鑫,赵妍妍,秦兵 单位:哈尔滨工业大学 情感分析是自然语言处理中的一个重要研究领域,其相关应用在各种真实场景中发挥着重要作用. 近年来,基于深度学习的方法逐渐成为情感分析的主流 ...

  8. python微博文本分析_基于Python的微博情感分析系统设计

    基于 Python 的微博情感分析系统设计 王欣 ; 周文龙 [期刊名称] < <信息与电脑> > [年 ( 卷 ), 期] 2019(000)006 [摘要] 微博是当今公众 ...

  9. 情感分析算法在阿里小蜜的应用实践

    来自:DataFunTalk 主要作者:宋双永 阿里达摩院 算法专家 编辑整理:Hoh 导读:人机对话一直是自然语言处理领域内的重要研究方向之一,近年来随着人机交互技术的进步,对话系统正逐渐走向实际应 ...

  10. CCL2022自然语言处理国际前沿动态综述——开放域对话生成前沿综述

    开放域对话生成前沿综述 --CCL 2022 自然语言处理国际前沿动态综述 文章目录 总体概览 1 基础任务 1.1 对话多样性代表工作 1.2 对话安全性的代表性工作 2 知识融入 2.1 基于常识 ...

最新文章

  1. Java:在Bean中使用PropertyChangeSupport支持PropertyChangeListeners
  2. oracle 查询本周数据生成下周数据
  3. 将CAD图纸转换出来的图片怎么设置其为高清JPG格式?
  4. 浅谈Laravel中的设计模式(四) Contract 契约模式
  5. linux一行多个命令行,如何在一行中运行多个Linux命令
  6. 【JavaWeb】HTML+CSS
  7. 数字图像处理,图像锐化算法的C++实现
  8. 以太网帧的最小长度_802.3?以太网?看完你就懂了
  9. gc java root_深入理解Java中的Garbage Collection
  10. 诺拉公司2.6一亿元天价罚款侵权 宅男心中的入侵
  11. dell无法启动计算机,戴尔电脑装系统蓝屏无法启动怎么办
  12. 故宫博物馆爬虫(简略版)
  13. KVM多电脑切换器的KVM发展史
  14. 人工智能对人类有哪些影响 选择Python入门怎样
  15. 按字符串属性值对对象数组进行排序
  16. “智数据,创未来”——2018中国存储与数据峰会在京盛大举行
  17. poi hssfcellstyle 文字方向_揭秘!文字识别在高德地图数据生产中的演进
  18. 前端性能优化必备技能 - 利用 Chrome Dev Tools 进行页面性能分析
  19. Google、FB、Twitter国际讲师全确认,QCon上海2013火热报名中
  20. 百度贴吧BDUSS获取器

热门文章

  1. [转]Ubuntu下快速安装python
  2. oracle行号排序问题
  3. Linux 下Nginx+Tomcat 完美整合 nginx tomcat 整合方式
  4. list自定义排序工具类
  5. MyBatis -- 对表进行增删改查(基于注解的实现)
  6. Visualize real-time data streams with Gnuplot
  7. YUV420查表法高效、无失真的转换为RGB32格式
  8. spring mvc和spring的区别
  9. OpenStack云计算快速入门之三:OpenStack镜像管理
  10. Source Insight 4.0常见问题和常用配置