论文链接:添加链接描述
研究背景:为什么NN算法效果好但在不同数据集表现不同
现实世界的知识库通常是不完整的,这激发了自动预测缺失链接的研究。知识图谱补全(KGC)的一种流行方法是将实体和关系嵌入到连续的向量或矩阵空间中,并利用设计良好的得分函数f(h, r, t)来衡量三元组(h, r, t)的合理性。
之前的方法大多使用基于平移的方法,最近,大量基于神经网络的方法被提出。它们具有复杂的得分函数,这些函数利用了包括卷积神经网络、循环神经网络、图神经网络以及胶囊网络在内的“黑箱”神经网络。
虽然其中一些方法取得了相当高的性能提升,这在不同的数据集上并不一致。此外,人们现在对这些不寻常的行为没有进行深入分析。
在本文中,作者分析了这个问题,发现这归因于这些方法使用了不恰当的评估协议。
NN类算法在不同数据集上显示出不同的增益
最近提出的几个方法报告了在特定数据集上的高性能提升。然而,它们在另一个数据集上的性能并没有持续提高。

如图是不同方法在FB15K-237和WN18RR数据集上的MRR与ConvE的对比。
有效三元组与负三元组的得分分布
我们发现,对于最近的一些基于NN的方法,在这两个数据集上存在不一致的增益。
例如,在 ConvKB中,相比在FB15k-237上的ConvE有21.8%的提升,但在WN18RR上退化了42.3%,这令人惊讶,因为该方法据称比ConvE 更好。
另一方面,像RotatE和TuckER这样的方法在两个基准数据集上都给出了一致的提升。

一个例子,使用ConvKB模型获得的“有效三元组”和“负三元组”的得分分布。
58.8%的负采样三元组获得与有效三元组完全相同的分数。(越低越好)
在14,541个负采样三元组中,8,520个与有效三元组的得分完全相同。

在FB15K-237数据集上评估时,与有效三元组分配分数相同的负三元组数量的频率。结果显示,对于像ConvKB和CapsE这样的方法,大量的负三元组得到了与有效三元组相同的分数,而对于像ConvE这样的方法,这种情况很少出现。
平均而言,在FB15K-237的整个评估数据集上,ConvKB和CapsE分别有125和197个实体与有效三元组的分数完全相同,而ConvE的分数约为0.002,几乎可以忽略不计。
从NN类算法的forward中寻找原因

我们绘制了有效三元组 ReLU激活后变为零的神经元比例与它们在 FB15k-237 数据集上的归一化频率的对比。
结果显示,在ConvKB和CapsE中,应用ReLU后有很大一部分神经元(分别为 87.3%和 92.2%)变为零。
然而,对于ConvE,这个计数大大减少(约 41.1%)。由于几乎所有神经元的归零(ConvKB 至少为 14.2%,CapsE 为 22.0%),几个三元组的表示在前向传递期间变得非常相似,从而导致获得完全相同的分数。
不恰当的评估协议是NN方法异常行为背后的关键原因
在本节中,我们提出了知识图谱补全中可以采用的不同评估协议。我们进一步表明,不恰当的评估协议是最近一些基于nn的方法异常行为背后的关键原因。
如何处理相同的分数? 评估方法的一个重要方面是决定如何打破三元组同分的平局。
更具体的说,在给候选集打分时,如果模型中有多个得分相同的三元组,决定选择哪一个三元组。
我们为KGC设计一个通用的评估方案,它由以下三个不同的协议组成:
TOP:正确的三元组被插入到候选集的开头。
BOTTOM:正确的三元组被插入到候选集的末尾。
RANDOM:正确的三元组被随机的放置到候选集中。
基于三个评估协议的实验结果
基于三个评估协议的定义,可以明显看出 TOP 评估协议并没有严格评估模型。它获得了有偏差的模型,为不同的三元组提供相同的分数,这是一种不恰当的优势。另一方面,底层评估协议在推理时间内可能对模型不公平,因为它惩罚了给多个三元组提供相同分数的模型,如果许多三元组与正确的三元组得分相同,那么正确的三元组将获得尽可能最小的排名。因此,随机是最好的评估技术,它对模型既严格又公平。这符合我们在现实世界中遇到的情况: 给定几个得分相同的候选人,唯一的选择就是随机选择其中一个。因此,我们建议对所有的模型性能比较使用随机评估方案。
研究结论
在我们的实验中,我们将现有的 KGC 方法分为以下两类:
在不同评估方案下提供一致性能的方法。对于本文的实验,我们考虑了三种这样的方法- ConvE, RotatE 和 TuckER。
基于神经网络的方法,其性能受到不同评估协议的影响, ConvKB, CapsE, TransGate2 和 KBAT 都属于这一类。
我们研究了使用顶部和底部协议的效果,并将它们与随机协议进行比较。在他们的原始论文中, ConvE、RotatE 和 TuckER 使用了类似于所提出的随机协议的策略,而ConvKB、CapsE和KBAT则使用了TOP协议。我们还研究了多次运行的随机协议中的随机误差,我们报告了使用不同随机种子的5次运行的平均值和标准差。

GitHub链接:https://github.com/svjan5/kg-reeval

论文阅读《A Re-evaluation of Knowledge Graph Completion Methods》相关推荐

  1. 《基于卷积神经网络的深度迁移学习,用于燃气轮机燃烧室的故障检测》论文阅读

    目录 突出 抽象 引言 1.1动机 1.2文献综述获得的结论 1.3贡献 1.4组织 2方法 2.1燃汽轮机组故障知识共享 2.2迁移学习 2.3 基于卷积神经网络的深度迁移学习 2.4用于燃气轮机燃 ...

  2. 基于卷积神经网络和投票机制的三维模型分类与检索 2019 论文笔记

    作者:白静 计算机辅助设计与图形学学报 1.解决的问题 由于三维模型投影得到的视图是由不同视点得到,具有相对独立性,这种像素级的融合运算并没有直接的物理或者几何意义,更有可能造成图像有益信息淹没和混淆 ...

  3. TextCNN——基于卷积神经网络的文本分类学习

    1.CNN基础内容 CNN的全称是Convolutional Neural Network,是一种前馈神经网络.由一个或多个卷积层.池化层以及顶部的全连接层组成,在图像处理领域表现出色. 本文主要学习 ...

  4. 读懂深度迁移学习,看这文就够了 | 赠书

    百度前首席科学家.斯坦福大学副教授吴恩达(Andrew Ng)曾经说过:迁移学习将是继监督学习之后的下一个促使机器学习成功商业化的驱动力. 本文选自<深度学习500问:AI工程师面试宝典> ...

  5. 一种基于卷积神经网络的图像去雾研究-含matlab代码

    目录 一.绪论 二.去雾卷积网络 2.1 特征提取 2.2 多尺度映射 2.3 局部均值 2.4 非线性回归 三.实验与分析 四.Matlab代码获取 一.绪论 雾是一种常见的大气现象,空气中悬浮的水 ...

  6. 机械臂论文笔记(一)【基于卷积神经网络的二指机械手 抓取姿态生成研究 】

    基于卷积神经网络的二指机械手 抓取姿态生成研究 论文下载 摘要 第1章 绪论 1.1 抓取生成国内外研究现状 1.1.1已知物体抓取生成 1.1.2相似物体抓取生成 1.1.3 未知物体抓取生成 1. ...

  7. 毕业设计 - 基于卷积神经网络的乳腺癌分类 深度学习 医学图像

    文章目录 1 前言 2 前言 3 数据集 3.1 良性样本 3.2 病变样本 4 开发环境 5 代码实现 5.1 实现流程 5.2 部分代码实现 5.2.1 导入库 5.2.2 图像加载 5.2.3 ...

  8. 基于卷积神经网络与迁移学习的油茶病害图像识别

    基于卷积神经网络与迁移学习的油茶病害图像识别 1.研究思路 利用深度卷积神经网络强大的特征学习和特征表达能力来自动学习油茶病害特征,并借助迁移学习方法将AlexNet模型在ImageNet图像数据集上 ...

  9. Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类)

    Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类) 1.卷积神经网络 1.1卷积神经网络简介 1.2卷积运算 1.3 深度学习与小数据问题的相关性 2.下载数据 2.1下载原始数据 ...

  10. 基于卷积神经网络实现图片风格的迁移 1

    卷积神经网络详解 一.实验介绍 1.1 实验内容 Prisma 是最近很火的一款APP,它能够将一张普通的图像转换成各种艺术风格的图像.本课程基于卷积神经网络,使用Caffe框架,探讨图片风格迁移背后 ...

最新文章

  1. php 时间转换编号,PHP 时间的格式转换
  2. 微软CEO致雅虎董事会的最后通牒信
  3. 以后教育孩子学好数学的方法 多思动漫数学
  4. SDRAM 相关资料
  5. 基于JavaEE实现网上拍卖系统
  6. 一次搞懂建模语言UML
  7. php是范例,php基础范例
  8. 第四课-Log的使用
  9. 平时使用比较多的js脚本
  10. jQuery自己定义绑定的魔法升级版
  11. 虚拟机及CentOS7各个版本镜像下载地址
  12. 伪终端设备ttySx/ttyx/ptyMN/ttyMN/ptmx/(pts/x)
  13. 一文助你入门HTML(❤ ω ❤)
  14. Word文档Aspose.Words使用教程:构建适用于Android的Word转PDF应用程序
  15. 助你深刻理解——最长公共子串、最长公共子序列(应该是全网数一数二的比较全面的总结了)
  16. 图片错误无法打开怎么办?
  17. 加州大学伯克利分校与KyberNetwork联合进行去中心化交易所研究
  18. 将整数字符串转成整数值
  19. 从无人问津到产值超千亿,动力电池回收利用,是新金矿吗?
  20. properties中文乱码快速处理

热门文章

  1. MSI GK71 Sonic 电竞机械键盘 评测
  2. 中创算力|库里18万美元买个猴头像 到底是个啥?
  3. EOS :入门踩坑之学习 1 创建开发钱包
  4. Java导出Excel表
  5. seccomp sandbox简介
  6. telnet 636端口不通
  7. # 切削加工形貌的相关论文阅读【1】-球头铣刀铣削球面的表面形貌建模与仿真研究
  8. 小狐狸钱包(metamask)和币安链钱包的联网问题
  9. 计蒜客题库(Python):6、泥塑课
  10. 质量不同的球java编程_Java 实现小球碰撞GUI