论文读后笔记+小结

1.Abstract

本文提出了一种学习微博事件的连续表示以识别谣言的新方法。 所提出的模型基于循环神经网络 (RNN),用于学习捕获相关帖子的上下文信息随时间变化的隐藏表示。 来自两个真实世界微博平台的数据集的实验结果表明:

  1. RNN 方法优于使用手工特征的最先进的谣言检测模型;
  2. 基于 RNN 的算法的性能通过复杂的循环单元和额外的隐藏层进一步提高;
  3. 基于RNN的方法比现有技术更快速、更准确地检测谣言,包括领先的在线谣言揭穿服务。

2.Introduction

这一部分主要讲述了之前的技术以及使用RNN的原因和结果
使用RNN的原因
因为 RNN 中单元之间的连接形成了一个直接循环并创建了网络的内部状态 [LeCun et a/., 2015, 图 5],这可能允许它捕获谣言传播的动态时间信号特征。
利用 RNN,我们将事件的社会背景信息建模为可变长度的时间序列。 我们假设人们在接触谣言声明时会转发声明或对其发表评论,从而创建连续的帖子流。 这种方法在监督下从谣言帖子中学习时间和文本表示。 对两个真实世界微博数据集的大量实验表明,基于 RNN 的方法产生了出色的性能。 该模型还被证明对早期发现谣言是有效的,在初始传播后仅几个小时就可以达到足够的准确性。

contribution

  • 据我们所知,这是第一项使用深度学习模型进行微博谣言检测的研究。 基于 RNN 的模型对依赖手工特征的最先进的学习算法进行了显着改进。 该模型具有更大的可扩展性,并且可以通过复杂的循环单元和额外的隐藏层比现有方法更准确地检测谣言。
  • 基于RNN 的模型进一步允许早期检测,与现有基线(例如领先的在线谣言揭穿服务)相比,表现出明显的功效。
  • 我们为该任务构建了两个带有真实标签的微博数据集,总共包含超过 5,000 个声明,可扩展到 500 万篇相关微博帖子。 我们将这个大型谣言数据集完全公开以用于研究目的。

3.RNN: Recurrent Neural Network

该部分主要介绍了RNN以及LSTM和GRU单元,讲述了他们的算法流程,如果想详细了解,可以参考我的博客,RNN,LSTM,GRU

4.RNN-based Rumor Detection

这一部分主要介绍如何将第三部分的算法用在谣言检测中

首先将微博帖子的传入流转换为连续变长时间序列

每一个微博下面可能都有评论,而且评论有时间序列,对应RNN的输入,但是有的微博下面的评论可能是千万个,对此建模的RNN序列会非常长,是非常耗时且成本高。 因此,可以将帖子分批成时间间隔,并将它们视为时间序列中的单个单元,然后使用 RNN 序列对其进行建模。 采用RNN序列的参考长度来构建时间序列。 应正确捕获代表扩散中的帖子密集的时间跨度; 采用的时间间隔数量近似于 RNN 的参考长度。
下面的算法描述了该过程:

最初,我们将整个时间线平均分为 N 个间隔(即 N 是参考长度)。 然后,我们的系统尝试通过删除集合 Uq 中的空区间来发现非空区间 U’ 的集合(即 U’ 中的每个区间至少有一条推文,删除没有评论的时间区间),选取最多的连续的非空的时间间隔数目的集合U 。 如果 U 中的区间数低于 N 且区间数多于上一轮,我们将区间减半,继续分区; 否则,它返回由 U 给出的已发现的连续间隔。这样就有很大的机会使连续的时间间隔数变多, 更容易达到N的数量。

然后描述具有不同类型隐藏单元和层的 RNN 进行分类


简要介绍三个模型:
图(a)是tanh-RNN 是基本结构,其中隐藏单元没有门控。 因此,它可以以有限的方式跨时间间隔捕获上下文。
图(b)中带有门机制,为LSTM或者GRU模型可以捕获句子长时间依赖,然而,由于门控单元,参数的规模显着扩大。 例如,由于引入了重置门和更新门,GRU 将原始参数空间增加了三倍。 为了降低复杂度,在输入层和隐藏层之间添加了一个嵌入层(固定长度为 100),使得参数的整体规模变得更小。
图©通过添加第二个 GRU 层来进一步开发基于 GRU 的多层结构,该层捕获不同时间步长之间的更高级别的特征交互。
公式如下图:

5.Experiments and Results

这部分就是实验和结果展示
该实验使用的是 Twitter (www.twitter.com) 和新浪微博 (weibo.com) 构建了两个微博数据集
表 2 显示了所有系统的性能。 我们的模型在两个数据集上都优于所有基线。 最简单的 RNN 模型 tanh-RNN 在 Twitter 上的准确率达到 82.7%,在微博上达到 87.3%。 这一结果表明,基本的 RNN 可以有效地学习判别特征。 所有基线都采用手工制作的功能或规则; 因此,它们在学习深度潜在特征及其相关性方面受到限制。

图 3 显示了基于 RNN 的方法的学习曲线。 在这两个数据集中,GRU 和 LSTM 比 tanh-RNN 收敛得更快,损失更低

图 4 显示了我们的模型在不同期限内与 SVMTS(表 2 中的最佳基线)和 DT-Rank(一种早期检测特定算法)的准确性。 在最初的几个小时内,基于 RNN 的方法的准确率上升更快,稳定更快,表明我们的方法具有优越的早期检测性能。 特别是,GRU-2 可以在 12 小时内以 83.9% 的 Twitter 和微博 89.0% 的准确率检测谣言,这比基线和平均官方报告时间要早得多。

谣言检测论文精读——1.IJCAI2016-Detecting Rumors from Microblogs with Recurrent Neural Networks相关推荐

  1. 论文阅读:Adding Attentiveness to the Neurons in Recurrent Neural Networks

    目录 Summary Details (Implementation) 原来的 RNN 结构 变为 Element-wise-Attention Gate (EleAttG) 后 论文名称:Addin ...

  2. 论文笔记:Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks

    Dynamic Scene Deblurring Using Spatially Variant Recurrent Neural Networks(利用空间变化循环神经网络对动态场景去模糊) 这是C ...

  3. 谣言检测论文精读——11.PAKDD2020-SAFE: Similarity-Aware Multi-Modal Fake News Detection

    Abstract 作者指出现在的谣言检测文章很少考虑视觉和文本之间的关系(相似性),但是这种相关性是很重要的,比如说一个假新闻文章为了吸引读者的注意力,用了一张和文本毫不相干图片.所以作者提出了一个相 ...

  4. 谣言检测论文精读——3.WWW2018-Detect Rumor and Stance Jointly by Neural Multi-task Learning

    1.Abstract 谣言帖子经常在参与用户中引发多变的.主要是有争议的立场. 因此,确定相关帖子的立场可能与成功检测谣言有关.我们提出了一个联合框架,统一了两个高度相关的任务,即谣言检测和立场分类. ...

  5. Ma Jing博士的谣言检测 论文总结

    第一篇<Detect Rumors Using Time Series of Social Context Information on Microblogging Websites> 由 ...

  6. 论文阅读 - Joint Beat and Downbeat Tracking with Recurrent Neural Networks

    文章目录 1 概述 2 信号预处理 3 分类神经网络 4 动态贝叶斯网络(HMM) 4.1 原始的bar pointer model 4.2 原始的bar pointer model的缺点 4.3 改 ...

  7. 谣言检测论文分享(三)

    论文分享之 Rumor Detection on Twitter with Tree-structured Recursive Neural Networks Jing Ma , Wei Gao , ...

  8. 【论文研读】【医学图像分割】【BCRNN】Fine-grained Recurrent Neural Networks for Automatic Prostate Segmentation ...

    [论文研读][医学图像分割][BCRNN]Fine-grained Recurrent Neural Networks for Automatic Prostate Segmentation inUl ...

  9. 论文笔记 NAACL 2016|Joint Event Extraction via Recurrent Neural Networks

    文章目录 1 简介 1.1 动机 1.2 创新 2 背景知识 3 方法 3.1 编码 3.1.1 句子编码 3.1.2 RNN编码 3.2 预测 3.2.1 触发词预测 3.2.2 论元角色预测 3. ...

  10. AI医药论文笔记--GraphDTA: Predicting drug–target binding affinity with graph neural networks

    GraphDTA:用图神经网络预测药物-靶点结合亲和力 论文题目 GraphDTA: Predicting drug–target binding affinity with graph neural ...

最新文章

  1. 京东超大规模联邦学习探索实践
  2. 【控制】《多无人机协同控制技术》周伟老师-第4章-基于 PID 的无人机编队运动控制策略
  3. ALV输出无法指定STATUS
  4. 同时寻找最大数和最小数的最优算法 第二大数
  5. Python切分文本(将文本文档切分为词列表)
  6. php extension,php的extension要开启哪些
  7. 相关性分析和假设检验
  8. amd编码器 hevc_HEVC/H.265硬件编码器实现杂谈
  9. wake-on-lan java_大神教你用Python实现Wake On Lan远程开机功能
  10. HBuilderX 打包 vue 项目生成 apk
  11. 【源码】结构支持向量机的块坐标Frank-Wolfe优化
  12. 8.千峰教育os与窗口控制与内存修改与语言----自制随堂笔记
  13. word2016毕业论文不同章节设置不同页眉方法
  14. linux vi只读文件,linux下vi编辑只读文档无法保存的解决方法
  15. 动画交互设计软件:Principle for Mac
  16. python networkx 边权重_科学网—NetworkX:关于边的权重及其画图 - 胡海华的博文
  17. Arduino温湿度监测与股票涨跌提醒
  18. describe是sql的关键字
  19. 蚊子看了想咬人,人类看了都说好
  20. 一根网线,让整栋宿舍楼熄灯后不再吵闹

热门文章

  1. java学习的电脑_请问学习java需要什么配置的笔记本电脑?
  2. 期货大佬给交易者的交易箴言,值得珍藏品读!
  3. 一点接入全网互通,企业上云就用它!
  4. p2psear正在连接服务器,P2PSearcher无法连接到网络,也无法连接到服务器
  5. MIT6.828 Part B: Copy-on-Write Fork
  6. 如何在2015年后的MacBook Air上安装双系统
  7. Python 爬虫之初体验(实习僧)
  8. 微信端跳到外部浏览器进行apk文件下载
  9. 计算机二级考试vb试题,2016计算机二级考试《VB》真题练习
  10. 德鲁克:卓有成效管理者的5项基本能力