在图表示学习中打破同构图和异构图之间的壁垒

摘要

同构性和异构性是图的固有属性,用来描述两个连接的节点是否具有相似的属性。虽然已经提出了许多图神经网络(GNN)模型,目前尚不清楚如何设计一个模型,让该模型能够适应各种图特征。这项工作通过识别三个图特征来解决这一挑战,包括自我节点特征、聚合节点特征和图结构特征,这三个特征对图表示学习至关重要。我们进一步提出了一种新的GNN模型,称为OGNN(全能图神经网络),该模型提取所有三种图特征并自适应融合它们,以实现模型能够适应各种图特征。我们通过大量的实验证明了,OGNN的优越性。

1. 引言

早在2016年就有研究人员证明了图神经网络(GNNs)是一种强大的方法来学习节点分类任务的图表示方法。基于图同质性或异质性的基本假设,研究者提出了不同的GNN模型设计。一方面,许多模型的前提是假设图特征为图同质性,这意味着图中的链接节点倾向于共享类似的属性或标签。这些GNN模型采用一种消息传递范式,通过图中的边缘递归地传播和聚合节点特征,以产生平滑的节点表示,我们把这些GNN模型称为同源型GNN模型。

另一方面,最近的一些工作经验地证明了基于同质性的GNN模型在异构图上的性能较差,而异构图具有与同质性相反的性质——异质性。这些图表的例子包括在线交易网络,以及蛋白质网络。为异构图设计的GNN模型采用了针对性的策略在异构图上得到了很好的效果,但将这类方法运用到同构图上其准确率基本和早先的模型类似或者更差。我们把这些GNN模型称为异源型GNN模型。

基于同质性的GNN和基于异质性的GNN都不是理想的,因为它们在同质性和异质性之间无形地建立了一道墙。一个GNN可以在异质性图或同质性图上很好地工作,但不能同时在两者上工作。然而,现实世界的图数据可能具有不同级别的同质性。在确定合适的GNN模型之前,首先将图划分为同质性或者异质性是一个麻烦的问题。更糟糕的是,有些图不能简单地划分为同质性或者异质性。所以一个亟待解决的问题就是要开发出一种GNN模型可以在多种性质的图上进行学习。

针对这一问题,本文提出了一种能很好推广到同质性全谱的全能GNN (OGNN)模型。OGNN的设计动机是观察到图中的每个节点可以由不同类型的特征建模,包括自身的特征、相邻节点的特征以及与其他节点的连接。根据图的同质性,这些特征在确定节点的属性时具有不同的重要性。OGNN的基本思想是对这些特征进行有效的变换和自适应融合,得到图中每个节点的表示。我们的主要贡献总结如下:

  1. 我们确定了对图表示学习至关重要的图特征的三个方面:自我节点特征、聚合节点特征和图结构特征。我们分析了这些图形特征的重要性,并提出了提取这些特征的一般形式。我们详细的消融研究表明,这些特征对于具有不同同质性的图具有不同的重要性。
  2. 我们提出OGNN模型,它可以推广到同质谱上的图。在双层优化框架下,OGNN将三种图特征与自适应特征融合在一起,可以有效地学习图表示。
  3. 我们进行了大量的实验,使用覆盖全同质性谱的合成和真实图基准,将OGNN与最先进的GNNs进行比较。OGNN优于8个基线模型,在9个真实数据集上的平均排名为1.56。具体而言,在真实数据集上,OGNN实现了更高的节点分类精度,平均比GCN高4.55%。

这里点评一下,作者这边的创新点还是很新颖的,毕竟将两个具有不同性质的领域融合在一起了。当然这也很符合现在深度学习的一种趋势,那就是大模型的概念。

2. 符号定义与参数

在本章中,基本上简单介绍了一下基本的图神经相关的知识以及符号的定义问题。这里提两个点:

  1. 要打破同构与异构的壁垒,而且还要准确率高。首要要解决的就是模型能不能识别出图特征。在本文中特征的筛选方法具体如下:

    定义一个标签为Y\mathbf YY的图G=(V,E)\mathcal G =(\mathcal{V,E})G=(V,E),则边的同构性定义为:

​ 它表示连接具有相同类标签的两个节点的边的分数。边同质性的取值范围是 0 到 1。边同质性接近 1 的图称 为同质性图,而边同质性接近于 0 的图称为异质性图。

​ 2.通过公式1我们可以得出这个是用一个空间卷积的思想来处理这些问题的。

很明显的感觉到,这些函数符号和传统的定义的有点出入。这是不是也给我们在写论文的时候一点启示。

3. 差异同质性下的图表示学习

尽管已经提出了许多 GNN模型,但它们中的大多数都是基于图特征是同质性或异质性的假设下设计的,这使得它们无法很好地泛化到其他的图特征的数据集中。总而言之,现有的 GNN 在具有各种同质性设置的图上几乎没有表现出始终如一的良好性能。因此,在本文中,我们旨在设计一种新的 GNN,该 GNN 可以很好地泛化具有不同同质性的图。

在这章中作者基本上把目前几个经典的模型运用到在其不擅长的领域上,例如将GCN用到异构图上进行计算。这样做完得出的实验结果表明:同构图上的模型用到异构图上效果还不如mlp,同理为异构图而设计的模型用到同构图上性能下降的也是十分明显的。

4. OGNN:一个适用于各种情况的GNN模型

在本文中,作者指出对于图特征的学习,其中最重要的有三个特征分别是:自我节点特征、聚合邻域特征和图结构特征。

  1. 自我节点特征:在不考虑节点邻域的情况下,对节点的原始特征进行变换而得到的节点嵌入。
  2. 聚合邻域特征:通过捕获从邻域到目标节点的信息来补充自我节点特征。
  3. 图结构特征:尽管聚合邻域特征涉及目标节点周围的局部连接,但由于置换不变聚合过程,它丢失了相当多的图结构信息。因此,有必要将图结构信息作为图表示学习的独立信息源。

OGNN的设计

1. 特征提取器

其中X就是特征矩阵,通过公式我们不难看出就是特征矩阵进行线性变化,因为线性变换在我们的经验评估中始终达到最佳精度。在聚合邻居节点的时候,为了提高感受野,利用了邻接矩阵。

这样就利用了一些谱分解的工作原理。

2. 自适应特征融合

这三种类型的特征在建模图信息中扮演着不同的角色,因此它们在不同的同质设置中的重要性也不同。自适应加权特征融合模块为每个特征分配一个可训练的标量重要性分数,以便它可以自动从输入图中学习特征的重要性:

公式5中H是融合后的特征,激活函数用的是relu,p是可训练参数π\piπ权重矩阵,最后通过一个softmax层来输出最终的结果。

3. 双层优化

为了联合训练模型参数和特征融合权值,我们借鉴了双层优化的思想

损失函数如式6,其中 G 是图,X 和 Y 分别是原始节点特征和真实标签,并且 y^i∈Ypred\hat y_i ∈ \mathbf Y_{pred}y^​i​∈Ypred​ 是我们模型对节点 i 的预测。那么我们的双层优化的目标是:

5. 实验

本文的实验确实做的很多,同时也做的很好,这点是值得我在后面的论文中进行借鉴的。

syn-cora 的节点及其原始特征来自 Cora 数据集,而边缘是根据不同的同质性设置随机生成的。

在图表示学习中打破同构图和异构图之间的壁垒(上)相关推荐

  1. 在图表示学习中打破同构图和异构图之间的壁垒(下)

    在图表示学习中打破同构图和异构图之间的壁垒(下) 1. 文章信息 作者 Xiao Liu, Lijun Zhang, & Hui Guan (2022). 单位 期刊或会议 题目 Break ...

  2. KDD 2020 | 理解图表示学习中的负采样

    今天给大家介绍的是清华大学的Zhen Yang等人在KDD 2020发表的文章"Understanding Negative Sampling in Graph Representation ...

  3. 转g代码教程_图深度学习入门教程(九)——图滤波神经网络模型

    本教程是一个系列免费教程,争取每月更新2到4篇.(由于精力有限,近期停止了一段时间,在此向大家道个歉). 主要是基于图深度学习的入门内容.讲述最基本的基础知识,其中包括深度学习.数学.图神经网络等相关 ...

  4. NeurIPS 2022|探明图对比学习的“游戏规则”:谱图理论视角

    ©作者 | 刘念, 王啸 单位 | 北邮 GAMMA Lab 研究方向 | 图神经网络 论文标题: Revisiting Graph Contrastive Learning from the Per ...

  5. 【图神经网络】图分类学习研究综述[2]:基于图神经网络的图分类

    基于GNN的图分类学习研究综述[2]:基于图神经网络的图分类 论文阅读:基于GNN的图分类学习研究综述 3. 基于图神经网络的图分类 3.1 卷积 3.2 池化 论文阅读:基于GNN的图分类学习研究综 ...

  6. java 抽象工厂 类图_spring学习中常用到的工厂,抽象工厂学习 | 学步园

    工厂模式有简单工厂模式,工厂方法模式和抽象工厂模式几种形态.其中简单工厂模式和工厂方法模式已经在前面作过介绍.在这里,我们来介绍抽象工厂模式. 抽象工厂模式是所有形态的工厂模式中最为抽象和最具广泛性的 ...

  7. d3.js折线图_学习使用D3.js创建折线图

    d3.js折线图 by Sohaib Nehal 通过Sohaib Nehal 学习使用D3.js创建折线图 (Learn to create a line chart using D3.js) 使用 ...

  8. 同构图、异构图、属性图、非显式图

    最重要的4类图数据: 同构图(Homogeneous Graph).异构图(Heterogeneous Graph).属性图(Property Graph)和非显式图(Graph Constructe ...

  9. 华为云ModelArts图深度学习,学习知识还能考取微认证

    作为人工智能最前沿的技术之一,图深度学习被公认是人工智能认识世界实现因果推理的关键,也是深度学习未来发展的方向.但深度学习对图数据模型的支持性差一直是众多研究者难以攻克的难点,因此图深度学习在实际生产 ...

最新文章

  1. 一.jquery.datatables.js表格显示
  2. JavaAppArguments
  3. idea未进行快捷键配置时的快捷键
  4. idea下git log乱码问题
  5. PHP面向对象(三)
  6. 不要打我,不要打我,不要打我啊啊
  7. 解决Git 重复输入用户名和密码的问题
  8. 超市也开始玩“内卷”?
  9. 思科模拟器叫什么_《班主任模拟器》第155关怎么过 通关技巧分享
  10. 【Computer Organization笔记05】运算器基本功能,定点运算器,Am2901的组成与功能,VHDL硬件描述语言
  11. WIN7 VC2008 express 安装问题及其创建第一个cpp文件
  12. ANSYS mesh网格划分
  13. 工程师职业发展的四个阶段
  14. 动环监控系统的主要功能,动环监控系统的监控对象有哪些
  15. 年薪45万阿里程序员想跳槽vivo,当他晒出期望工资,以为我看错了
  16. Android图形shape的gradient渐变色背景
  17. 机器学习——EM算法
  18. c语言程序设计教程北京邮电大学出版社答案,C语言程序设计教程习题答案~主审郭浩志北京邮电大学出版社.doc...
  19. Android 8.1 应用安装过程总结
  20. 普华i-VirtualCloud应用案例之--国家海洋局北海分局

热门文章

  1. 设备像素比(devicePixelRatio)
  2. mysql-数据(记录)相关操作(增删改查)及权限管理
  3. ajax浏览器后退 iframe,ajax后退解决方案
  4. Altium Designer系列:元件英文翻译
  5. 为什么按空格会删除后面的字?为什么输入字会覆盖后面的字?
  6. html网页制作图案,HTML+CSS实现画出一个太极八卦图案
  7. 花费超450亿美元,埃及即将迎来一座智慧型的新首都
  8. freeswitch编译安装,初探, 以及联合sipgateway, webrtc server的使用场景。
  9. PPC系统内部和注册表的一些解释与修改
  10. 八款主流512MB MP3优缺点大曝光