【论文阅读】WWW 2022:Cross-modal Ambiguity Learning for Multimodal Fake News Detection
Cross-modal Ambiguity Learning for Multimodal Fake News Detection
- 论文来源:WWW 2022
- 论文链接:https://dl.acm.org/doi/10.1145/3485447.3511968
- 数据集地址:待补充
Motivation
作者认为当单模态特征很明显时,多模态融合反而会降低性能,反之单一模态表现不够时,需要引入多模态特征。
另外,作者还认为模态间的gap会造成融合时的信息损失,因此通过将不同模态的特征映射到一个嵌入空间来对齐模态特征。
Method
文章提出的模型由这几个部分组成:
编码器
模态对齐模块
单一模态的信息估计
多模态融合
分类头
其中2,3,4是主要架构。
编码器
采用Bert和Resnet-34分别对文本和图片进行编码。
模态对其模块
通过设计一个辅助任务,对比学习不同模态间的相似度。具体来说,就是从原始数据集D中真实类别的新闻中构建一个辅助对比数据集D2:
- 来自同一条真实新闻的图片和文本,相似度为1(positive)
- 来自不同真实新闻的图片和文本,相似度为0(negative)
通过对比函数计算辅助任务的损失。
训练过程的顺序如下:
训练好的模块用于将不同模态特征映射到一个共享的空间。
模态信息估计
通过KL散度衡量单一模态之间的分布,个人理解是将分布近似认为是模态信息之中的偏差,偏差越小说明单一模态的信息越有用,多模态融合的特征分配的权重就会越小。
多模态融合
感觉没什么好说的,就是注意力上变花样,排列组合一下诶。
分类头
输入的特征包括视觉模态、文本模态、融合模态,这三个特征通过信息估计的结果分配权重组合起来。
然后是MLP外面再套一个Softmax输出。
整个模型的损失包括了:分类损失、辅助任务的损失
Result
总的结果:
消融实验结果:
从上到下依次是:去掉对其模块、去掉信息估计、去掉模态融合
另外作者针对信息估计中使用不同函数、模态融合使用不同方式额外做了实验:
【论文阅读】WWW 2022:Cross-modal Ambiguity Learning for Multimodal Fake News Detection相关推荐
- 文献记录(part19)--Cross modal similarity learning with active queries
学习笔记,仅供参考,有错必纠 关键词:主动学习;跨模态相似学习;度量学习 文章目录 Cross modal similarity learning with active queries 摘要 简介 ...
- 论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering,SENet,用于大规模子空间聚类的自表达网络
论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering. SENet--用于大规模子空间聚类的自表达网络 前言 摘要 ...
- 人脸方向论文阅读(二)——Deep Face Representations for Differential Morphing Attack Detection
人脸相关论文阅读(二)--Deep Face Representations for Differential Morphing Attack Detection 论文信息: 发表在Cryptogra ...
- 论文阅读——FPGA based Accelerators of Deep Learning Networks for Learning and Classification:A Review
论文阅读之FPGA硬件加速Review FPGA-based Accelerators of Deep Learning Networks for Learning and Classificatio ...
- 【论文阅读】A2S-Det: Efficiency Anchor Matching in Aerial Image Oriented Object Detection
A 2 S-Det:航空图像定向目标检测中的高效锚点匹配 论文地址:https://www.mdpi.com/2072-4292/13/1/73/htm 二次阅读笔记也可以看看,下面这篇博客翻译会更准 ...
- 【论文阅读 NeurIPS 2022】A Large Scale Search Dataset for Unbiased Learning to Rank
文章目录 前言 Abs Intro 2.Preliminary 2.1.Ubiased Learning to Rank 2.2.Existion ULTR Datasets 3.Dataset De ...
- 论文阅读《Meta-FDMixup:Cross-Domain Few-Shot Learning Guided by Labeled Target Data》
Background & Motivation 之前看的小样本论文大部分是目标域和源域属于同一个域,比如 COCO 数据集里的小样本设定:60类为 Base,20类为 Novel.Base 和 ...
- 论文阅读:A Survey on Transfer Learning
本文主要内容为论文<A Survey on Transfer Learning>的阅读笔记,内容和图片主要参考 该论文 .其中部分内容引用与博客<迁移学习综述a survey o ...
- 论文阅读:A Survey on Deep Learning for Named Entity Recognition
这是一篇2020年发的命名实体识别的综述性论文,从NER的语料库,定义,评估指标,到深度学习中的NER的技术都有涉及到. A Survey on Deep Learning for Named Ent ...
最新文章
- 单向链表JAVA代码
- [每周软件]:Cucumber:未完待续的原因
- 黑入苹果、特斯拉竟如此容易!这位鬼才的攻击方法火了!
- 【 MATLAB 】 WLLS algorithm Simulation of TOA - Based Positioning
- 洛谷—— P1875 佳佳的魔法药水
- linux apache fcgi,编译安装apache2.2对应的mod_proxy_fcgi.so模块步骤,因为使用apache--phpfpm 需要这个...
- css expressionr,CSS Expression讲解
- 微软建议Windows 10开发人员升级到Visual Studio 2017
- php callback 多线程,PHP cURL并发里的callback那行是什么效能
- od拦截消息 comboboxonchange_某聊天软件逆向之偷看消息不quot;已读quot;
- Linux使用命令记录
- 重磅!双一流高校学位点有变化!教育部公布2019年增列、撤销的学位点
- 计算机上word如何批量打印,word批量调页面设置 关于Word如何批量打印
- 2022 腾讯云 阿里云返佣政策对比
- 服务器winsxs文件夹怎么清理工具,如何清理Win7系统winsxs文件夹中的垃圾?
- 安装oracle显示无法解析的,1、pl/sql无法连接本机的oracle(ORA 12154:TNS:无法解析指定的连接标识符)解决方法:pl/sql不能安装在Program Files(...
- 《团队领导力》培训笔记
- Python批量裁剪图形外围空白区域
- 【Verilog】inout 端口信号的使用
- 租用服务器如何选择带宽,带宽越大越好吗
热门文章
- SpringCloud之微服务应用监控
- outlook 2016 选项里 签名 无设置 点击无反应(和outlook2013相同)
- VIM 教程文档的学习
- 转化率最高的10个购物网站的经验
- 中国互联网发展的三大机遇
- sql语句时间范围查询(包含开始时间和结束时间)
- 7z 头部错误 数据错误_打开一个7z的加密文件,显示CRC错误操作出错怎么办
- 8g内存一般占用多少_8g存储空间win10开机占用多少
- C语言详解:函数递归专题
- 安卓网apk安装器_安卓APP推荐:假日时间规划师,定时音乐播放器,最小的APK提取器...