Sarcasm Detection with Self-matching Networks and Low-rank Bilinear Pooling

click here:文章下载

方法综述:

本文中使用了三个模型,分别是self-matching networkBi-LSTMLow-rank Bilinear Pooling method(LBPR)

self-matching network: 通过单词对间的信息,获取句子的incongruity information
Bi-LSTM: 通过句子的序列信息,获取句子的compositional information
Low-rank Bilinear Pooling method: 融合incongruity informationcompositional information

各模型算法:

self-matching network

target: 求输入句子的 attend feature vector : fa∈Rk⟹fa=S⋅af_a \in R^k \implies f_a=S·afaRkfa=Sa
S是输入句子的word-embedding表示,S∈Rk×nS \in R^{k \times n}SRk×n
于是问题转变成为,求解self-matched attention vector : a∈Rna \in R^naRn
其中,k为单词表示维度,n为句子单词数。

求解a∈Rna \in R^naRn

考虑到,单词对表示向量间进行内积运算,只抓住特征向量间的相关性,却忽视了情感信息,所以定义了一种新的计算方式。对于单词对(ei,ej)(e_i, e_j)(ei,ej)ei∈Rke_i \in R^keiRk:
joint feature vector: wi,j∈R⟹wi,j=tanh(ei⋅Mi,j⋅ejT)w_{i,j} \in R \implies w_{i,j}=tanh(e_i · M_{i,j} · e_j^T)wi,jRwi,j=tanh(eiMi,jejT)
其中,Mi,j∈Rk×kM_{i,j} \in R^{k \times k}Mi,jRk×k,是要学习的参数。
建立self-matching information matrix : W∈Rn×nW \in R^{n \times n}WRn×n:


WWW每行取最大值,组成向量 m∈Rnm \in R^nmRn
⟹a=Softmax(m)⟹a∈Rn\implies a=Softmax(m) \implies a \in R^na=Softmax(m)aRn

Bi-LSTM

target: 利用Bi-LSTM的隐含层输出,作为输入句子的特征向量feature vector : fl∈Rd⟹fl=h1f_l \in R^d \implies f_l=h_1flRdfl=h1d是超参数hi∈Rdh_i \in R^dhiRd

注:此处有个疑问,为什么只使用第一个时间步的输出呢?最后一个时间步的输出又如何呢?

Low-rank Bilinear Pooling

target: 融合上述两个模型得到的向量fa∈Rk,fl∈Rdf_a \in R^k, f_l \in R^dfaRk,flRd,得到最终的融合向量f∈Rcf \in R^cfRc,并进行二分类,得到输出向量pi∈R2p_i \in R^2piR2c是超参数
f=UT⋅fa∘VT⋅fl+bf=U^T \cdot f_a \circ V^T \cdot f_l + bf=UTfaVTfl+b
pi=Softmax(Wf⋅f+b)p_i=Softmax(W_f \cdot f + b)pi=Softmax(Wff+b)
其中,U∈Rk×c,V∈Rd×c,g∈Rc,Wf∈R2×c,b∈R2U \in R^{k \times c}, V \in R^{d \times c}, g \in R^{c}, W_f \in R_{2 \times c}, b \in R^2URk×c,VRd×c,gRc,WfR2×c,bR2,这些都是需要学习的参数。
注:∘\circ 表示 Hadamard Product,简单来说就是矩阵对应位置元素相乘。

训练目标:



待学习参数:θ={Mi,j,U,V,g,Wf,b}\theta = \{ M_{i,j},U,V,g,W_f,b \}θ={Mi,j,U,V,g,Wf,b}
超参数:d,c,λd, c, \lambdad,c,λ

Sarcasm Detection with Self-matching Networks and Low-rank Bilinear Pooling相关推荐

  1. 【卷积神经网络的加速】Speeding up Convolutional Neural Networks with Low Rank Expansions

    主题:[深度卷积神经网络的加速] Speeding up Convolutional Neural Networks with Low Rank Expansions 附上论文链接:上一篇中提到的低秩 ...

  2. 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》

    深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...

  3. 读书笔记:Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks

    Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks 著名的faster R-CNN 当然应该好好 ...

  4. 谣言检测相关论文阅读笔记:Towards Multi-Modal Sarcasm Detection via Hierarchical Congruity Modeling

    Towards Multi-Modal Sarcasm Detection via Hierarchical Congruity Modeling with Knowledge Enhancement ...

  5. 【论文阅读】Multi-Modal Sarcasm Detection 图文反讽识别

    Multi-Modal Sarcasm Detection 图文反讽识别 题目:Multi-Modal Sarcasm Detection in Twitter with Hierarchical F ...

  6. 【论文泛读】Modeling Intra and Inter-modality Incongruity for Multi-Modal Sarcasm Detection

    论文题目:Modeling Intra and Inter-modality Incongruity for Multi-Modal Sarcasm Detection 时间:2020 来源:EMNL ...

  7. Scalable Object Detection using Deep Neural Networks 阅读笔记

    Scalable Object Detection using Deep Neural Networks 基于深度神经网络的可伸缩目标检测 14年的文章 是一个用于检测的显著性启发式神经网络模型, 分 ...

  8. 论文 | Credit Card Fraud Detection Using Convolutional Neural Networks

    本篇博客继续为大家介绍一篇论文,也是关于用卷积神经网络 CNN 来进行信用卡欺诈检测的. 论文信息 论文题目:Credit card fraud detection using convolution ...

  9. [Paper]Cardiologist-Level Arrhythmia Detection with Convolutional Neural Networks

    Cardiologist-Level Arrhythmia Detection with Convolutional Neural Networks 基于卷积神经网络的心脏科医生级别的心律失常检测 A ...

最新文章

  1. The Minimum Cycle Mean in a Digraph 《有向图中的最小平均权值回路》 Karp
  2. golang中的jwt
  3. APICloud中app如何在手机端测试
  4. 再回首Java第十一天
  5. HDU 2112 HDU Today lt;SPFA算法+map函数gt;
  6. C++ 易混淆的概念-sizeof和strlen、char* 和char[]、*p++和(*p)++
  7. python 文本框内容变化_监听文本输入框内容值的改变——4种方法
  8. mysql 5.6 cmake_mysql5.6如何使用cmake编译
  9. 【java学习之路】(java SE篇)005.面向对象基础入门part2
  10. 中信所 分区 查询_SCI期刊引证报告自科版2018(中信所分区)
  11. log4j 日志书写格式_Log4J日志配置详解
  12. 计算机网络中的www服务,计算机网络基础练习题01
  13. Vue动态加载并注册组件
  14. 线程停止(stop/intrrupt)
  15. Jmeter 阶梯线程组
  16. 用python-turtle优雅的画椭圆
  17. 深度解析C语言文件操作以及常见问题
  18. 佛祖保佑永无BUG python版本
  19. android 获取屏幕旋转方向,android获取手机屏幕尺寸和旋转方向
  20. android 西班牙语,Android新增语言的方法(墨西哥的西班牙语)

热门文章

  1. 源代码托管网站BitBucket
  2. pycharm使用虚拟环境时出现的那些问题
  3. 深入理解ActiveMQ支持的2类消息发送接收模型queue和topic
  4. 蚂蚁监控平台 - antmonitor架构设计
  5. git的学习笔记(一):git本地操作
  6. 7005-艺赛旗RPA8.0产品介绍(2019.01)
  7. vulnhub靶场——Hacker-Kid-v1-0-1
  8. 心脏出血漏洞(CVE-2014-0160)
  9. 计算机网络不同网段,WIN7系统计算机不同网段如何共享资源
  10. 【python第一章 基础捋顺,第二章 python基础语法】