概要

本文研究任务: 预测故事中的事件会引起故事角色怎样的情绪,是一个多标签的分类任务。
以往的方法将label看作一些匿名类去做预测,对于每种情绪做二分类,忽略了情绪标签(emotion label)本身的语义信息。

本文主要思路:本文提出使用情绪标签的语义,来引导模型在表示输入故事时的attention(即,改进输入故事的编码过程);进一步地,本文发现,一个事件所能引起的几种情绪通常是相关的,一个引起人们开心情绪的事件很少会伴随着伤心情绪的产生。因此,本文显式地使用label embedding的方式来表示模型的label类别;同时,在训练及推断的过程中追踪label之间的关联。【label embeddings + label correlations】
代码:github

任务形式 Emotion Inference

本文涉及的Emotion Inference任务定义于ROCStories数据的一个子集上,需要在给定故事context的情况下,推断出每个事件所引起的各个故事角色的反应。
事件由story中的一个句子所组成,表示为 x s x_s xs,该事件前的所有提到过角色 c c c的句子记作 x c x_c xc,需要编码 x s x_s xsx c x_c xc,并将其作为输入送入多标签分类层。总共有8种emotion。

label语义表示 Label Semantics using Embeddings

首先使用Label对应的单词(如joy、fear等)的embedding来对label的embedding进行初始化,然后采用以下两种方式进行label embedding的使用:

  1. Label Attention Network
    Label Embedding可以用于指导编码网络抽取emotion相关的信息,本文采用了Label-Embedding Attentive Network(LEAM)架构来产生与label相关的表示,其主要思想计算label与输入之间的attention值,以此来加权各个单词对于最终表示的贡献。
    B t B_t Bt表示由BERT模型得到的每个单词的表示,用 J J J进行label的表示,计算出attention值,并对句子表示H进行单词加权,然后用于emotion分类。


  2. Label as Additional Input
    上一种方法中label embedding的表示是模型从头开始学习的,在第二种方法中作者想要利用BERT等预训练语言模型的知识,因此作者在原始的输入文本后拼接了8句表示emotion label的句子,记作 L s L_s Ls,其中每句话的形式表示为:[character] is [emotional state]。这样就可以通过BERT模型得到label的表示,再和句子表示进行上述过程。
    应该没理解错吧,没有开源代码。这步创新点好像有点小,但很合理。

label语义关联 Label Semantics using Correlations

首先,需要确定的一个问题是,Label的关联是否存在?为了得到这个问题的答案,作者计算了数据集中各种label的相关系数,得到如下的热力图。从下图可以发现,label之间的是有相关关系的,如JOY和SAD之间存在着高度的负相关,而JOY和TRUST之间则存在着高度的正相关。因此,利用上label之间的关联,可能可以提高模型的表现。

作者使用一个额外loss来进行惩罚,使得与真实label正相关的类也能得到概率的增加。

这个loss借鉴了Review-Driven Multi-Label Music Style Classification by Exploiting Style Correlations : However, the widely used discrete label representation does not apply to the task of music style classification, because the music styles are not mutually exclusive and highly related to each other The discrete distribution without label relations makes the model over-distinguish the related labels …
在这篇论文当中,我们可以首先得到一个原始的label概率分布 z z z,然后,通过一个表示Label之间关联程度的矩阵 G \mathcal{G} G,将label概率分布进行变换,得到分布 e e e,label本身对应的0-1向量也做相应转换得到 y ′ y' y,这样就可以得到更加soft的分布,体现各个类之间的联系。最后原始分布和soft化之后的分布一起训练。




这里的矩阵 G \mathcal{G} G在本文中是由学习得到的(a learned correlation matrix)。

无监督数据半监督 Semi-supervision on Unlabeled Data

大概是因为标注比较困难,ROCStories数据集中只有一小部分被用于本任务,有大约40k数据没有进行多标签的标注,因此作者想要利用上这一部分数据进一步提高模型表现。
下面的 e e e表示的是通过Label Graph所计算出来的soft概率。
为了减小 L r e g \mathcal{L_{reg}} Lreg,label正相关的样本所得出来的logits分布会接近,而负相关的样本所得出的logits分布差异会变大。
这对于多标签的任务算是半监督了。

实验结果


case study:Label语义和Label关联的作用。

ACL2020-Modeling Label Semantics for Predicting Emotional Reactions 论文要点相关推荐

  1. Collaborative Learning of Label Semantics and Deep Label-Specific Features for MLC

    Collaborative Learning of Label Semantic and Deep Label-Specific Features for Multi-Label Classifica ...

  2. Deep Crossing: Web-Scale Modeling without Manually Crafted Combinatorial Features【论文记录】

    交叉特征有很好的效果,但人工组合发现有意义的特征很难 深度学习可以不用人工挖掘特征,还可以挖掘到专家都没找到的高阶特征 特色在于残差单元的使用,特征的表示 1 摘要 automatically com ...

  3. 《PaDiM: a Patch Distribution Modeling Frameworkfor Anomaly Detection and Localization》论文阅读笔记

    作者:Thomas Defard, Aleksandr Setkov, Angelique Loesch, Romaric Audigier 出自:Nov2020 作者提出了一种新的斑块分布建模框架P ...

  4. 医学自然语言处理相关资源整理

    github链接,持续更新 Chinese_medical_NLP 医疗NLP领域(主要关注中文) 评测数据集 与 论文等相关资源. 中文评测数据集 中文医学知识图谱 英文数据集 相关论文 中文医疗领 ...

  5. [论文阅读笔记41]关于医学的bert专题

    论文1:BioBert 论文题目:BioBERT: a pre-trained biomedical language representation model for biomedical text ...

  6. 【论文解读 ESWC 2018 | R-GCN】Modeling Relational Data with Graph Convolutional Networks

    论文题目:Modeling Relational Data with Graph Convolutional Networks 论文来源:ESWC 2018 论文链接:https://arxiv.or ...

  7. 【论文阅读】Modeling the world from internet photo collections

    Modeling the world from internet photo collections论文阅读 1.摘要 2.介绍 3.先前技术(历史介绍) 4.重建过程 4.1 关键点的检测和匹配 4 ...

  8. 论文笔记-Vanilla Transformer:Character-Level Language Modeling with Deeper Self-Attention

    论文笔记-Vanilla Transformer:Character-Level Language Modeling with Deeper Self-Attention 1. 介绍 2. Chara ...

  9. 【论文笔记】A Multi-Task Learning Formulation for Predicting Disease Progression

    A Multi-Task Learning Formulation for Predicting Disease Progression 论文地址 摘要 1. 介绍 2. 多任务回归方程 2.1 时间 ...

最新文章

  1. GET和POST到底啥区别???
  2. 红帽系列linux自行配置本地yum源
  3. 从单体应用到微服务架构演化
  4. 口袋操作系统_可以装进口袋的主机要有多小?驰为LarBox迷你主机入手体验
  5. -Git Linux vi/vim 命令 按键 MD
  6. 【程序员必看】如何用Python从0开始创建一个区块链?
  7. mysql eval,mysql中是否有类似于eval的写法的,答案在这里
  8. RestTemplate 发送 get 请求使用误区 多值为null
  9. python描述_Python描述符(Descriptor)入门
  10. 以后华为鸿蒙也要越狱了,玩机福音:华为 EMUI 升级鸿蒙之后依然可使用太极运行 Xposed...
  11. 维纳滤波 c语言,C版:自适应维纳滤波方法的语音增强(C2-1)
  12. CAD如何导出天正各版本DWG图纸?CAD图形导出教程
  13. 软件项目管理 需求管理
  14. 微信桌面版如何同时登陆两个微信账号
  15. 结构化、半结构化、非结构化数据
  16. 利达主机如何注册设备_利达主机操作说明
  17. wix图片导入设置_奇葩史的奇葩事 | [译]:WiX Toolset入门——内置的WixUI界面使用配置...
  18. ajax.updater 返回值,jquery中Ajax.updater的等价物是什么?
  19. 教师档案管理系统php,智睿教师档案管理系统 v8.6.0
  20. Jconsole和VisualVM使用指南

热门文章

  1. 2022下半年软考各地报名时间汇总
  2. Ralink-Uboot学习
  3. 怎样在表格中选出同一类_怎样将一个excel表格里头的多个同一个名称下面的多个数据筛选出来...
  4. 如何自己修电脑(电脑修复大全)
  5. 2023最新版会声会影有哪些新功能介绍?
  6. 仿新浪微博图片加载进度条——JLPieProgressView
  7. supervise守护进程
  8. vue组件v-vue-onkeypress限制只能输入数字
  9. 天津天地伟业程序员怎么样_关注|天津217家融资公司“失联”!发现快举报
  10. 乐视手机型号和cpu