一、背景

SVM(2010)
MV-RNN(2012)
CNN(2014)
FCM(2014)
DT-RNN(2014)
DT-RNN使用RNN建模依赖树后,通过线性组合的方式将节点的词嵌入与其子节点的词嵌入结合起来。而本文则是利用子树结合词嵌入,再使用CNN捕捉特征,F1值大幅提高。

以往的关系分类研究已经验证了使用依赖最短路径或子树进行关系分类的有效性。二者具有不同的功能。本文提出了一种新的结构:Augmented Dependency Path(ADP,增强依赖路径),将两个实体间的最短依赖路径和与最短依赖路径相连的子树结合起来:使用递归神经网络建模子树,将生成的依赖子树的表示附加到最短依赖路径上的单词上,从而使最短依赖路径上的单词获得新的词嵌入,然后使用卷积神经网络捕捉最短依赖路径上的关键特征。

传统的依赖解析树:

本文提出的ADP结构:

加粗部分为句子的最短依赖路径。从图二中可以看出,具有相似最短依赖路径的两个句子却具有不同的relation,表明只使用最短依赖路径具有局限性,同时使用子树后则可以辨别两者的区别。

二、模型

1.词嵌入

首先,句子中的每个word和最短依赖路径中的每个dependency relation都被映射成向量xw,xr,二者维度相同


2.使用RNN对依赖子树进行建模

对于最短依赖路径中的每个word,使用一个递归神经网络,从其叶节点到根节点(即这个word本身),自上而下地生成一个subtree embedding: cw


如果一个词是根节点,将其subtree embedding表示为cLEAF

每对父节点与子节点之间都存在一个依赖关系r,设置一个变换矩阵Wr,在训练过程中学习

从而得到 **cw**的计算公式:


其中R(w,q)表示词w和其子节点词q之间的依赖关系。

计算过程举例可以参考帖子:https://blog.csdn.net/appleml/article/details/78778555

3.使用CNN对最短依赖路径进行建模

经上述步骤后,我们得到了最短依赖路径上的word的表示pq(维度为dim+dimc) 和dependency relation的表示xr(维度为dim)


应用window processing,当窗口大小k=3时,得到的n个窗口表示为(n为句子长度):


s表示start,e表示end

将每个窗口内的k个向量拼接,得到


nw是窗口内word的个数,Xi 表示第i个窗口的拼接向量

随后设置一个含有l个卷积核的filter:

将filter应用于每一个窗口Xi ,得到

最后应用一个最大池化操作


L是一个l维向量,与句子长度n无关

4.分类

可以对L添加一些外部特征(如NER和WordNet上义词):

经过一个全连接层后,送入softmax分类器分类:

采用交叉熵损失,反向传播训练。

依赖树生成采用:Stanford Parser (Klein and Manning, 2003) with the collapsed option.

三、实验结果


待解决的疑问:

1.dependency relation的嵌入**xr**是预先训练好的还是随机初始化的?
2.本文中的最短依赖路径相当短(甚至只有3个词),而SDP-LSTM(2015)中的最短依赖路径却比较长(也许是使用了不同版本的Stanford parser???)

A Dependency-Based Neural Network for Relation Classification(DepNN,2015)论文阅读笔记相关推荐

  1. 红外图像增强(2)Brightness-Based Convolutional Neural Network for Thermal Image Enhancement (TIECNN)论文阅读

    ** 红外图像增强(2)Brightness-Based Convolutional Neural Network for Thermal Image Enhancement (TIECNN)论文阅读 ...

  2. 论文阅读笔记:Multi-view adaptive graph convolutions for graph classification

    论文阅读笔记:Multi-view adaptive graph convolutions for graph classification 文章目录 论文阅读笔记:Multi-view adapti ...

  3. 【文本分类】A C-LSTM Neural Network for Text Classification

    ·摘要:   本文作者将CNN和RNN(LSTM)结合使用,应用到了NLP的文本分类任务中. ·参考文献:   [1] A C-LSTM Neural Network for Text Classif ...

  4. HD-CNN: HIERARCHICAL DEEP CONVOLUTIONAL NEURAL NETWORK FOR IMAGE CLASSIFICATION(泛读)

    一.文献名字和作者    HD-CNN: HIERARCHICAL DEEP CONVOLUTIONAL NEURAL NETWORK FOR IMAGE CLASSIFICATION, 2014 二 ...

  5. 论文阅读笔记:《Hyperspectral image classification via a random patches network》(ISPRSjprs2018)

    论文阅读笔记:<Hyperspectral image classification via a random patches network>(ISPRSjprs2018) 论文下载地址 ...

  6. Sentiment Classification towards Question-Answering with Hierarchical Matching Network 论文阅读笔记

    Sentiment Classification towards Question-Answering with Hierarchical Matching Network 论文阅读笔记 这篇论文介绍 ...

  7. 论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering,SENet,用于大规模子空间聚类的自表达网络

    论文阅读笔记(2):Learning a Self-Expressive Network for Subspace Clustering. SENet--用于大规模子空间聚类的自表达网络 前言 摘要 ...

  8. LiDAR-based Panoptic Segmentation via Dynamic Shifting Network(论文阅读笔记)

    LiDAR-based Panoptic Segmentation via Dynamic Shifting Network(论文阅读笔记) 环形扫描骨干网络.动态漂移.一致性驱动的融合 一.重点内容 ...

  9. 论文阅读笔记:Intriguing properties of neural networks

    论文阅读笔记:Intriguing properties of neural networks 深度学习对抗样本的开山之作 要点 以往的观点认为深度神经网络的高层特征中每一个分量描述了一种特质,但是这 ...

  10. 【异构图笔记,篇章3】GATNE论文阅读笔记与理解:General Attributed Multiplex HeTerogeneous Network Embedding

    [异构图笔记,篇章3]GATNE论文阅读笔记与理解:General Attributed Multiplex HeTerogeneous Network Embedding 上期回顾 论文信息概览 论 ...

最新文章

  1. 嵌入式开发在过去20年中是如何演变的
  2. oracle 远程exp导出,EXP远程导出完整Oracle数据库
  3. oa提醒模块要素_OA办公系统的选型有哪些要素?OA系统如何给企业带来巨大价值?...
  4. java 安装后找不到文件_(已解决)jdk安装 系统找不到文件C:\ProgramData\Oracle\Java\javapath\java.exe...
  5. 第三十六讲:用好共享内存工具:Slab管理器
  6. ElasticSearch5.3插件开发(一)控制台打印信息
  7. IIS网站的权限设置问题
  8. 瑞信中国前CEO唐臻怡加盟商汤科技出任副总裁
  9. 打开IE窗口自动最大化效果
  10. c语言中输出值作用,printf在c语言中什么意思
  11. 同台加载_跨年官宣 | “爷青回”我只服湖南卫视跨年 李易峰陈伟霆马天宇“古剑三侠”同台...
  12. 在线购物系统后台登录界面html代码,电子商城(购物网站)html模板源码
  13. SumatraPDF 适配 EPUB,MOBI
  14. java cximage_CxImage的几种应用举例
  15. TripAdvisor猫途鹰翻译志愿者线上任务评测
  16. linux 添加udp端口映射,iptables下udp端口转发
  17. 自抗扰控制(ADRC)—— python 实战
  18. 沃德移动尾气净化设备监控管理系统
  19. 百度Java出现:“现在学java的都是傻子”相关搜索!
  20. js判断APP和浏览器

热门文章

  1. Anaconda升级与Spyder升级与报错处理(镜像源更新设置)
  2. IE11 调试 网络面板空白 的解决办法
  3. 毕业设计-基于微信小程序的校园资讯发布系统
  4. 16x16点阵c语言程序的十六进制,16X16点阵C语言程序(16X16 bitmap C language program).doc...
  5. FlashDecoding++
  6. 数据结构之线性表的应用——完整代码实现
  7. 零基础学习 AI 绘画的进阶之路 · 起始篇
  8. 基于JAVA党员信息管理计算机毕业设计源码+系统+lw文档+部署
  9. 计算机系统大作业(无图版)
  10. 2011.11.23 POJ2531解题报告【谨以此文,纪念自己跨过POJ50道题的小里程碑】