Coarse-grain fine-grain coattention network for multi-evidence QA 阅读笔记
Coarse-grain fine-grain coattention network for multi-evidence QA (ICLR-2019)
动机: |
从single-hop QA 到multi-hop QA 由coarse-grain reasoning 和 fine-grain reasoning 所激励 |
贡献: |
作者在本文中提出了一种Coarse-Grain Fine-Grain Coattention Network (CFC),它以一种从粗粒度到细粒度的渐进的方式来寻找查询所对应的答案部分。模型整体上包括两部分:
在两个模块中均使用了层次化的coattention以及self-attention,模型通过这两种注意力机制实现query、support document 和candicate 之间不同部分的关注。 |
模型: |
1. 利用Bi-GRU对query, support document 和candicate 进行编码,分别得到:其中, 2. coarse-grain module:旨在先用co-attention 对 query 和support document 建立codependent 表示,再利用self-attention 机制总结co-attention context.
其中,
将coattention简写为:
将self-attention 简写为:
3. Candidate-dependent fine-grain module: 该模块首先根据候选答案寻找其在 support document 中对应的上下文部分,这里称为mention [这部分通过简单的lexical matching 其中每一个mention都通过self-attention得到对应的mention representation; 接着根据mention representation和query使用coattention来计算一个coattention context; 最后对这个coattention context 使用self-attention机制,目的是对每个候选答案进行打分。
其中, 类似地,得到mention的序列表示
4. Score aggregation:第j个candidate的得分为coarse-grain module 和 fine-grain module 打分的总和: 最后再汇总所有的candidate. |
IDE: |
分层的attention:在不同的输入间执行attention操作。这样做可以迫使模型关注输入的不同部分(跟重注意力机制提出的机制类似)。 Coarse-grain module 和 fine-grain module 间无相互关联。 |
。
Coarse-grain fine-grain coattention network for multi-evidence QA 阅读笔记相关推荐
- Deep Network with Stochastic Depth(阅读笔记)一种随机深度的正则化方法
题记: 最近Swin Transformer在计算机视觉上大放异彩,成为许多视觉榜单上的霸主,然而传统的Conv卷积如Resnet就真的不行了吗? 一些学者就传统的卷积网络进行了深入的研究,并通过细致 ...
- LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation【论文阅读笔记】
文章目录 1.文章为了解决什么问题? 2.文章提出了什么方法? 3.模型架构以及原理? 4.模型有效性分析 5.改进的效果如何以及比较的对象 6.future work 这篇论文提出了LightGCN ...
- 2021AAPM大赛第一名技术报告Designing an Iterative Network for Fanbeam-CTwith Unknown Geometry 阅读笔记
什么是第一名的含金量呢?他的RMSE直接领先最前沿方法一个数量级! 文章中多次提到了 forward model / operator,于是我进行了一些查阅,给出个人的一些理解: 作为 forward ...
- CVPR2020:Deep Unfolding Network for Image Super-Resolution 论文阅读笔记
Deep Unfolding Network for Image Super-Resolution Abstract 1. Introduction 2. Related work 2.1. 退化模型 ...
- DPLink: User Identity Linkage via Deep Neural Network From Heterogeneous Mobility Data 阅读笔记
DPLink: User Identity Linkage via Deep Neural Network From Heterogeneous Mobility Data WWW2019paper ...
- 《Densely Connected Hierarchical Network for Image Denoising》阅读笔记
一.论文 <Densely Connected Hierarchical Network for Image Denoising> 近年来,深度卷积神经网络已应用于众多图像处理研究中,并且 ...
- DUF:Deep Video Super-Resolution Network Using Dynamic Upsampling Filters ...阅读笔记
DUF:Deep Video Super-Resolution Network Using Dynamic Upsampling Filters Without Explicit Motion Com ...
- Enriched Long-term Recurrent Convolutional Network for Facial Micro-Expression Recognition阅读笔记
文章主要的贡献:提出了一个Enriched Long-term Recurrent Convolutional Network (ELRCN)来进行表情识别. 和其他大多数文章一样,作者先从数据上下功 ...
- D2C-Net: A Dual-branch, Dual-guidance and Cross-refine Network for Camouflaged Object Detection阅读笔记
IEEE Transactions on Industrial Electronics 2021 Kang Wang; Hongbo Bi; Yi Zhang; Cong Zhang; Ziqi Li ...
最新文章
- winrunner事务概念的代码应用(毫秒级)
- POJ - 3468 A Simple Problem with Integers(分块)
- Ubuntu 16.04 安装 Gazebo
- 非线性降维-核主成分分析KPCA
- Mysql5.7.26解压版(免安装版)简单快速配置步骤,5分钟搞定(win10-64位系统)
- sqlquerystress
- spring mvc和spring的区别
- 《Effective Python 2nd》——元类与属性
- Ubuntu下VIM的安装和基本用法
- 网站Webshell大马密码极速暴力爆破工具-cheetah
- Origin多峰拟合
- C#汉诺塔递归算法实现
- Win10+NVIDIA TITAN Xp | RTX 2060+Python3.6+TensorFlow_gpu2.1.0+keras2.3.1+cuda10.1+cudnn7.6.5.32记录
- 解除Windows 10休眠时自动唤醒设置
- 鸿蒙系统充电动画,荣耀智慧屏首发抢先体验:电视只是小功能,鸿蒙系统才是真亮点...
- u8系统服务器已停止怎么办,紧急通知!用友U8报错:enterpriseportal 已停止工作的解决办法!...
- windows环境下cmd切换不同盘目录
- 墨者mysql注入_SQL注入实战-MySQL-墨者学院
- Flink 全网最全资源(视频、博客、PPT、入门、原理、实战、性能调优、源码解析、问答等持续更新)
- 2.1、水平对称天线双极性天线
热门文章
- iReport学习一:中文字体显示
- F2FS源码分析-1.3 [F2FS 元数据布局部分] Checkpoint结构
- Android中使用sqlite数据库实现对象的存储
- vue v-html 中@click 和 class 不生效问题解决方案
- Design compiler综合教程
- 使用python计算行列式
- Armijo条件,Wolfe条件,Goldstein条件
- android wifi讲解 wifi列表显示
- MTK芯片系列手机的维修宝典
- 【论文阅读】Cross-domain Correspondence Learning for Exemplar-based Image Translation