Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering

文中提到当前一些处理VQA任务的方法都是基于处理Image Captioning任务的方法，具体就是采用卷积递归神经网络，但是这种方法不能很好的模拟spatial inference。文中提出Spatial Memory Network用于处理VQA任务。Spatial Memory Network存储图像不同区域的神经激活单元到网络的记忆中，并且根据问题选择与其相关的图像区域。
本文主要贡献：
1.提出结合注意机制的Multi-hop Memory Network
2.在第一个hop设计了一个注意结构，利用每个单词向量捕获fine-grain分布
3.建立一系列明确需要spatial inference 的问题分析网络工作原理
4.与其它模型进行比较
模型框架图：

Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering相关推荐

论文笔记:Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answeri
Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering Hu ...
论文解读：Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for VQA
这是关于VQA问题的第五篇系列文章.本篇文章将介绍论文:主要思想:模型方法:主要贡献.有兴趣可以查看原文:Ask, Attend and Answer: Exploring Question-Guid ...
R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering
博主水平有限,大部分为机翻摘要: 最近,视觉问答(VQA)已经成为多模式学习中最重要的任务之一,因为它需要理解视觉和文本模式.现有方法主要依靠提取图像和问题特征来通过多模态融合或注意机制来学习它们的 ...
《Generating Question Relevant Captions to Aid Visual Question Answering》（生成问题相关标题，以帮助视觉回答问题）论文解读
下面是我对最近阅读的论文<Generating Question Relevant Captions to Aid Visual Question Answering>的一些简要理解一. ...
MUTAN:Multimodal Tucker Fusion For Visual Question Answering
MUTAN:Multimodal Tucker Fusion For Visual Question Answering 0.写在前面在介绍本篇论文前,我们首先介绍什么是矩阵分解,tucker张量分 ...
VideoQA论文阅读笔记——TGIF-QA: Toward Spatio-Temporal Reasoning in Visual Question Answering
论文: TGIF-QA: Toward Spatio-Temporal Reasoning in Visual Question Answering 作者: 首尔国立大学来源: CVPR2017 源 ...
【论文分享】Relation-Aware Graph Attention Network for Visual Question Answering
分享一篇nlp领域运用注意力机制设计视觉问答系统的文章,只是对文章进行翻译以及简单的归纳. 目录二.动机三.方法 1.问题定义 2.模型结构 2.1 图的构建 2.2 关系编码器 2.3 多模融合 ...
Visual Question Answering: Datasets, Algorithms, and Future Challenges心得体会
最近刚好在写综述,也看了一篇较早的综述性文章,作为VQA入门性文章还是值得一看的,这边自己记录了一下关于这篇文章的阅读体会,以及相关部分翻译,以供自己学习写作为用. 文章下载地址:Visual Que ...
视觉问答（Visual Question Answering）论文初步整理
刚找的综述性文章:这两篇我没怎么看不知道怎么样 Visual Question Answering: Datasets,Algorithms, and Future Challenges Visual ...

Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering

Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering相关推荐

最新文章

热门文章