Coarse-grain fine-grain coattention network for multi-evidence QA (ICLR-2019)

动机:

从single-hop QA 到multi-hop QA

由coarse-grain reasoning 和 fine-grain reasoning 所激励

贡献:

作者在本文中提出了一种Coarse-Grain Fine-Grain Coattention Network (CFC),它以一种从粗粒度到细粒度的渐进的方式来寻找查询所对应的答案部分。模型整体上包括两部分:

  • coarse-grain module:根据给定的query和support document通过coattention建立一种粗粒度的表示,然后通过self-attention进行总结,此时它是不知道候选答案的
  • gine-grain module:通过比较query在所有文档中出现候选答案的上下文来为每个答案打分,通过coattention建立关于候选答案所在上下文和问题的表示

在两个模块中均使用了层次化的coattention以及self-attention,模型通过这两种注意力机制实现query、support document 和candicate 之间不同部分的关注。

模型:

1. 利用Bi-GRU对query, support document 和candicate 进行编码,分别得到:

其中,,分别是query, 第i个support document 和 第j个候选答案的词向量。

2. coarse-grain module:旨在先用co-attention 对 query 和support document 建立codependent 表示,再利用self-attention 机制总结co-attention context.

  • 计算query和support document 的similarity matrix:

  • support document summary vector 和 query summary vector:

其中,为给定一个query中的词其所有document 词中的attention 分配

  • document context

  • document summary vector

将coattention简写为:

  • 执行self-attention 操作;

将self-attention 简写为:;表示第 i 个support document 的summary vector, 令为所有support document的summary vector,

表示support document 和candicate 进行coarse-grain 的打分操作。

3. Candidate-dependent fine-grain module: 该模块首先根据候选答案寻找其在 support document 中对应的上下文部分,这里称为mention [这部分通过简单的lexical matching
实现的];

其中每一个mention都通过self-attention得到对应的mention representation;

接着根据mention representation和query使用coattention来计算一个coattention context;

最后对这个coattention context 使用self-attention机制,目的是对每个候选答案进行打分。

  • 计算一个mention 的表示:

其中,表示第 j 个候选答案中的第k个mention在第i个support document 中的开始和结束位置的下标,为第k个mention 的表示。

类似地,得到mention的序列表示,其中表示第j 个candidate 在所有的support document中的mention数量、

  • 对mention 和query 执行coattention 操作

  • 再对coattention context 执行self-attention 操作

  • 使用线性网络对candicate 执行打分:

4. Score aggregation:

第j个candidate的得分为coarse-grain module 和 fine-grain module 打分的总和:

最后再汇总所有的candidate.

IDE:

分层的attention:在不同的输入间执行attention操作。这样做可以迫使模型关注输入的不同部分(跟重注意力机制提出的机制类似)。

Coarse-grain module 和 fine-grain module 间无相互关联。

Coarse-grain fine-grain coattention network for multi-evidence QA 阅读笔记相关推荐

  1. Deep Network with Stochastic Depth(阅读笔记)一种随机深度的正则化方法

    题记: 最近Swin Transformer在计算机视觉上大放异彩,成为许多视觉榜单上的霸主,然而传统的Conv卷积如Resnet就真的不行了吗? 一些学者就传统的卷积网络进行了深入的研究,并通过细致 ...

  2. LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation【论文阅读笔记】

    文章目录 1.文章为了解决什么问题? 2.文章提出了什么方法? 3.模型架构以及原理? 4.模型有效性分析 5.改进的效果如何以及比较的对象 6.future work 这篇论文提出了LightGCN ...

  3. 2021AAPM大赛第一名技术报告Designing an Iterative Network for Fanbeam-CTwith Unknown Geometry 阅读笔记

    什么是第一名的含金量呢?他的RMSE直接领先最前沿方法一个数量级! 文章中多次提到了 forward model / operator,于是我进行了一些查阅,给出个人的一些理解: 作为 forward ...

  4. CVPR2020:Deep Unfolding Network for Image Super-Resolution 论文阅读笔记

    Deep Unfolding Network for Image Super-Resolution Abstract 1. Introduction 2. Related work 2.1. 退化模型 ...

  5. DPLink: User Identity Linkage via Deep Neural Network From Heterogeneous Mobility Data 阅读笔记

    DPLink: User Identity Linkage via Deep Neural Network From Heterogeneous Mobility Data WWW2019paper ...

  6. 《Densely Connected Hierarchical Network for Image Denoising》阅读笔记

    一.论文 <Densely Connected Hierarchical Network for Image Denoising> 近年来,深度卷积神经网络已应用于众多图像处理研究中,并且 ...

  7. DUF:Deep Video Super-Resolution Network Using Dynamic Upsampling Filters ...阅读笔记

    DUF:Deep Video Super-Resolution Network Using Dynamic Upsampling Filters Without Explicit Motion Com ...

  8. Enriched Long-term Recurrent Convolutional Network for Facial Micro-Expression Recognition阅读笔记

    文章主要的贡献:提出了一个Enriched Long-term Recurrent Convolutional Network (ELRCN)来进行表情识别. 和其他大多数文章一样,作者先从数据上下功 ...

  9. D2C-Net: A Dual-branch, Dual-guidance and Cross-refine Network for Camouflaged Object Detection阅读笔记

    IEEE Transactions on Industrial Electronics 2021 Kang Wang; Hongbo Bi; Yi Zhang; Cong Zhang; Ziqi Li ...

最新文章

  1. winrunner事务概念的代码应用(毫秒级)
  2. POJ - 3468 A Simple Problem with Integers(分块)
  3. Ubuntu 16.04 安装 Gazebo
  4. 非线性降维-核主成分分析KPCA
  5. Mysql5.7.26解压版(免安装版)简单快速配置步骤,5分钟搞定(win10-64位系统)
  6. sqlquerystress
  7. spring mvc和spring的区别
  8. 《Effective Python 2nd》——元类与属性
  9. Ubuntu下VIM的安装和基本用法
  10. 网站Webshell大马密码极速暴力爆破工具-cheetah
  11. Origin多峰拟合
  12. C#汉诺塔递归算法实现
  13. Win10+NVIDIA TITAN Xp | RTX 2060+Python3.6+TensorFlow_gpu2.1.0+keras2.3.1+cuda10.1+cudnn7.6.5.32记录
  14. 解除Windows 10休眠时自动唤醒设置
  15. 鸿蒙系统充电动画,荣耀智慧屏首发抢先体验:电视只是小功能,鸿蒙系统才是真亮点...
  16. u8系统服务器已停止怎么办,紧急通知!用友U8报错:enterpriseportal 已停止工作的解决办法!...
  17. windows环境下cmd切换不同盘目录
  18. 墨者mysql注入_SQL注入实战-MySQL-墨者学院
  19. Flink 全网最全资源(视频、博客、PPT、入门、原理、实战、性能调优、源码解析、问答等持续更新)
  20. 2.1、水平对称天线双极性天线

热门文章

  1. iReport学习一:中文字体显示
  2. F2FS源码分析-1.3 [F2FS 元数据布局部分] Checkpoint结构
  3. Android中使用sqlite数据库实现对象的存储
  4. vue v-html 中@click 和 class 不生效问题解决方案
  5. Design compiler综合教程
  6. 使用python计算行列式
  7. Armijo条件,Wolfe条件,Goldstein条件
  8. android wifi讲解 wifi列表显示
  9. MTK芯片系列手机的维修宝典
  10. 【论文阅读】Cross-domain Correspondence Learning for Exemplar-based Image Translation