链接:https://arxiv.org/pdf/1809.05124.pdf

本文主要关注Network embedding问题,以往的network embedding方法只将是网络中的边看作二分类的边(0,1),忽略了边的标签信息,本文提出的方法能够较好的保存网络结构和边的语义信息来进行network embedding的学习。实验结果证明本文的方法在多标签结点分类任务中有着突出表现。

Background

Network embedding的工作就是学习得到低维度的向量来表示网络中的结点,低维度的向量包含了结点之间边的复杂信息。这些学习得到的向量可以用来结点分类,结点与结点之间的关系预测。

Model

本文将总体的损失函数分为两块:Structural Loss和Relational Loss,定义为:

Structural loss:

给定中心结点u,模型最大化观察到“上下文”结点v的情况下u的概率,C(v)表示点v的“上下文”结点,“上下文”结点不是直接连接的结点,而是用类似于deepwalk中的random walk方法得到。通过不断在网络中游走,得到多串序列,在序列中结点V的“上下文”结点为以点V为中心的窗口大小内的结点。本文采用skip-gram模型来定义Pr(u|v),Φ(v)是结点作为中心词的向量,Φ‘(v)是结点作为“上下文”的向量。Pr(u|v)的定义为一个softmax函数,同word2vec一样,采用负采样的方法来加快训练。

Relational loss:

以前也有方法利用了结点的标签,但是没有利用边的标签信息。本文将边的标签信息利用起来。边e的向量由两端的结点u,v定义得到,定义为:

其中g函数是将结点向量映射为边向量的函数:Rd*Rd->Rd’ ,本文发现简单的连接操作效果最好。

将边的向量信息置入一个前馈神经网络,第k层隐藏层定义为:

其中,W(k)为第k层的权重矩阵,b(k)为第k层的偏置矩阵,h(0)= Φ(e)。

并且将预测出的边的标签与真实的边的标签计算二元交叉损失函数。真实的边的标签向量为y,神经网络预测的边的标签向量为yˆ。边的损失函数定义为:

本文算法的伪代码如下:

结果分析

表1和表2展示了五种方法在两个数据集上结点分类的表现。本文使用了5%,10%,20%的含有标签的结点。本文考虑到了在现实中,有标签关系的稀有性,所以本文只使用了10%的标签数据。可以观察到即使是很小比例的标签关系,结果也优于基础方法。在ArnetMiner数据集上表现得比AmazonReviews好的原因是,类似于ArnetMiner数据集的协作网络,关系的标签通常指明了结点的特征了,所以对于结点分类来说,高于AmazonReviewers是正常现象。

总结

本文的方法相比于以往的network embedding方法的优势在于,除了利用了网络的结构信息,同时也利用了网络中的边的标签信息。在真实世界的网络中证实了本文的方法通过捕捉结点之间的不同的关系,在结点分类任务中,网络中的结点表示能获得更好的效果。

论文笔记整理:黄焱晖,东南大学硕士,研究方向为知识图谱,自然语言处理。



OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 | 利用边缘标签的网络嵌入强化方法相关推荐

  1. 论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答. 来源:Knowledge Based System 链接:https://www.sciencedirect.com/science/a ...

  2. 论文浅尝 | 重新实验评估知识图谱补全方法

    论文作者:Farahnaz Akrami,美国德州大学阿灵顿分校,博士生. 笔记整理:南京大学,张清恒,硕士生. 链接:https://arxiv.org/pdf/2003.08001.pdf 代码: ...

  3. 论文浅尝 | 利用指针生成网络的知识图谱自然语言生成

    论文笔记整理:谭亦鸣,东南大学博士,研究方向为知识图谱问答. 来源:Neurocomputing 382: 174-187 (2020) 链接:https://www.sciencedirect.co ...

  4. 论文浅尝 | 利用知识图谱嵌入和图卷积网络进行长尾关系抽取

    论文笔记整理:王狄烽,南京大学硕士,研究方向为关系抽取.知识库补全. 链接:https://arxiv.org/pdf/1903.01306.pdf 发表会议:NAACL2019 动机 现有的利用远程 ...

  5. 论文浅尝 | 基于动态记忆的原型网络进行元学习以实现少样本事件探测

    本文转载自公众号:浙大KG. 论文题目:Meta-Learning with Dynamic-Memory-Based Prototypical Network for Few-Shot Event ...

  6. 论文浅尝 | 利用知识-意识阅读器改进的不完整知识图谱问答方法

    论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答. 来源:ACL2019 链接:https://www.aclweb.org/anthology/P19-1417/ 本文提出了一种融合不完整 ...

  7. 论文浅尝 | 利用Lattice LSTM的最优中文命名实体识别方法

    本文转载自公众号:机器之心. 选自arXiv 作者:Yue Zhang.Jie Yang 机器之心编译 参与:路.王淑婷 近日,来自新加坡科技设计大学的研究者在 arXiv 上发布了一篇论文,介绍了一 ...

  8. 论文浅尝 | 利用常识知识图增强零样本和少样本立场检测

    笔记整理:张嘉芮,天津大学硕士 链接:https://aclanthology.org/2021.findings-acl.278.pd 动机 传统的数据驱动方法不适用于零样本和少样本的场景.对于人类 ...

  9. 论文浅尝 | 利用开放域触发器知识改进事件检测

    笔记整理 | 申时荣,东南大学博士 来源:ACL 2020 源码:https://github.com/shuaiwa16/ekd.git 摘要 事件检测(ED)是文本自动结构化处理的一项基本任务.由 ...

最新文章

  1. 关于C语言中的malloc和free函数的用法
  2. 深度 | 打败围棋冠军后,机器智能下一步能战胜黑客吗?
  3. 图文并茂: 二进制与十进制间的转换方法
  4. 两分钟搞定阿里SQL面试题:亿级表合并
  5. (23)System Verilog设计二分频电路
  6. mysql 字段加减_MySQL数据库开发常见问题及优化(续)
  7. pku 2251 Dungeon Master
  8. android实现QQ空间和QQ好友分享功能
  9. Android 集成支付宝支付
  10. ubuntu linux目录绿色高亮问题
  11. the little schemer 笔记(10.1)
  12. Titanic 生存预测(上)
  13. Qt是什么?有哪些优势用于图形界面开发
  14. 1021. Couples
  15. 计算机室电源插座的配置及配电线路,小型机安装场地要求及机房环境电气要求讲课教案.pdf...
  16. 程序设计大作业---超长正整数的减法
  17. Android 从网页中跳转到APP
  18. A*算法:启发式(heuristic)算法
  19. 1556_AURIX_TC275_复位系统控制单元
  20. 井字游戏判断赢家c语言,桌游「井字游戏 」了解条件式攻守与挫折后的再接再厉...

热门文章

  1. boost_1_48_0 在VS2008下的安装 Boost.Asio安装
  2. Linux kernel 同步机制(下篇)
  3. 串口UART串行总线协议
  4. linux驱动之ioctl
  5. MongoDB基本应用操作整理
  6. jsr 正则验证_Java数据校验(Bean Validation / JSR303)
  7. eltable刷新整个表格方法_利用SSAS实现PBI报表增量刷新
  8. 自己动手写java虚拟机_自己动手写操作系统(要了解的知识点)
  9. LeetCode 2110. 股票平滑下跌阶段的数目(滑动窗口)
  10. 天池 在线编程 捡胡萝卜(模拟)