背景

图神经网络在各个研究领域引起了广泛的关注并取得了显著的成绩。大多数算法都假设图中节点是成对出现的,即一条边只能连接两个节点。然而,在许多实际应用中,对象之间的关系是高阶的,超出了成对关系,可能会导致数据分布不平衡、无法准确描述对象之间的关系等问题。

超图(Hypergraph)提供了一种灵活而自然的建模工具来对这种复杂的关系进行建模。在许多真实的网络中,这种复杂关系普遍存在,因此激发了使用超图学习的问题。一种流行的学习方法是基于超图的半监督学习(SSL),其目标是对超图中未标记的顶点分配标签。

在推荐系统的图神经网络之中,对比学习SSL和图卷积算法受的启发,提出了HyperGCN,即超图卷积神经网络,这是一种基于超图的谱论来训练用于超图上半监督学习的GCN的新方法。

论文:Hypergraph convolution and hypergraph attention

定义

什么是超图?

对于我们熟悉的图而言,它的一个边(edge)只能和两个顶点连接;而对于超图来讲,它的边(这里叫超边,hyperedge)可以和任意个数的顶点连接。每个边所包含的顶点个数都是相同且为k个的,就可以被称为k阶超图。
        2阶超图就是我们平时所见到的图,因为我们平时的图由线条(edge,边)和点(vertice,顶点)构成,每条线都只包含两个点,所以这是符合2阶超图的定义的。
        超边的构建,将具有同一个属性的样本归到同一条超边里。因为每个样本具有若干个属性,所以一个顶点可以属于多条超边,如果在该数据集中有m个属性,那么超图就具有m条超边。因为我们通过该超图来描述数据之间的属性关系,所以我们称该超图为属性超图。如图所示:

可见,一个边连接多个顶点的图就是超图,相比于普通的图超图具有以下优势:

1、超图结构相对于一般图结构具有较强的数据样本间非线性高阶关联的刻画和挖掘能力;

2、超图结构相对于一般图结构能够更加准确地建模多元关系;

3、超图结构在处理多模态、异构数据时更加灵活,更方便多模态的融合与扩展;

4、超图结构相比于一般图结构在聚类过程上更有优势;

什么是超图卷积?

对于每个结点,我们都要考虑其所有邻居以及其自身所包含的特征信息。即普通的图卷积就是将节点和边之间的映射用矩阵的形式进行表达并且是在其某个一阶的子图上进行的操作。

而超图卷积是指针对超图定义一个拉普拉斯矩阵,即将超图变化为简单的图表示出来,在转化为简单图的表示过后就可以进行图卷积操作。但是需要注意的是需要进行如下的规范化:

这里的关键工作原理是,同一超边中的超节点相似,因此可能共享同一标签。先进性超边的确定,然后通过简化将超边简化为两个节点的边,最终聚合到中心节点。可以想象成,定义的带权简单图是一个层面,然后在另外的一个维度会有这些中间节点和带权简单图相连接。

什么是超图注意力?

超图的注意力目标是学习一个动态关联矩阵。获得能够更好地揭示顶点间内在关系地动态转移矩阵。
        一个直接办法是在H上使用注意力学习模块,在注意力机制下,没有将H看作每个顶点是否由某个超边相连,而是提出一个概率模型,概率模型能学习更多类,区别嵌入,并且能够描述顶点之间的关系。将H从01矩阵优化为注意力值表示。
        关联矩阵不是一个二元的连接矩阵,是超边和顶点关系的矩阵,所以要使在H上用注意力机制模块,必须假定边和顶点是可比的,只有节点集和超边集来自同一个homogeneous domain,才能对节点和超边进行比较。这取决于超图如何构造。

例如可以将中心节点和k个最近邻节点共同形成一个超边。当节点和超边可以比较时,可以得到超图的注意力机制。引用GAT的概念,定义一个顶点领域内的点的加权系数是attention系数。

应用:HyperGCN

论文:HyperGCN: A New Method of Training Graph Convolutional Networks on Hypergraphs

论文是基于半监督学习和图卷积的。

首先,基于谱域的图卷积公式如下:

这是一个2层的图卷积公式,其中A是标准化之后的邻接矩阵,是经过拉普拉斯矩阵变换得来的矩阵,其中包含了图中特别的信息。X是特征矩阵。然后后面一个是权重矩阵,是一个经过训练得到的参数矩阵。最外面是一个softmax函数将里面得到的数值映射到0~1的域中便于模型做出预测。

其次,图/超图上半监督学习的输入为一个图G,其中包括少量的labelled节点,大量的unlabelled节点。通过图上半监督学习,期望为没有标签的数据分配标签,得到更多更丰富的数据,便于后续工作的实现,作者使用了交叉熵作为半监督学习的损失函数:

超图卷积的步骤如下:

1. 对于每一个超边,因为超边里面包含很多个节点,然后我们现在就只选取2个节点,只选取信号特征最大的两个节点,然后这两个节点之间的边来代表超边。公式如下:

2. 然后在第一步里面定义的边上加上权重,经过这一步之后,就已经将超图变为简单带权图了
        3. 在有给出的每个节点的特征信号的时候就能够用以上的方法计算出超图的拉普拉斯矩阵了,这样也就能在超图中运用图卷积公式了。公式如下:

其中A是超图经过变换之后的带权领接矩阵,D是该邻接矩阵的度矩阵,然后I是单位矩阵。

单层的超图卷积网络
        最后简单图Gs标准化之后的带权邻接矩阵表示为As,然后在简单图Gs上使用图卷积公式。整个过程可以用下图来表示:

如图对于一个超图。首先是要将超        图转化为简单图。并且用定义的超图算子来确定边,具体的方法是:

​​​​​​​        ​​​​​​​        

公式的意思是,对于一个超边,我们选取其中包含节点隐含的信息的二阶范数的最大值最大的两个节点为带权简单图组成的边。

论文中还介绍了用中间节点增强的超图卷积网络的相关方法以弱化简化过程中的数据丢失,这里不再赘述该方法。

总结

超图的主要思想就是,同一超边中的超节点相似,因此可能共享同一标签,超图卷积的本质在于利用拉普拉斯变换转化为简单图后聚合再进行图卷积。

而在HyperGCN的操作中是先定义超图的拉普拉斯矩阵:

1. 对于每一个超边,因为超边里面包含很多个节点,我们现在就只选取2个节点,只选取信号特征最大的两个节点,然后这两个节点之间的边来代表超边。

2. 然后在前面的步骤中定义的边上加上权重,经过这一步之后,就已经将超图变为简单带权图了。

3. 因此,在有给出的每个节点的特征信号的时候就能够用以上的方法计算出超图的拉普拉斯矩阵了,到达在超图中运用图卷积公式的目的。

参考链接:超图上的卷积和注意力机制 - 墨天轮

推荐系统笔记(十七):对超图、超图卷积、超图注意力的初步理解和应用(HyperGCN)相关推荐

  1. 推荐系统笔记(十三):SGL算法的代码实现

    前言         本算法是在LightGCN的代码上的基础实现的,LightGCN的代码和原理参考我前面几篇的博客:推荐系统笔记(六):LightGCN代码实现_甘霖那的博客-CSDN博客 由于L ...

  2. 推荐系统笔记(九):SGL --利用自监督对比学习缓解推荐系统长尾效应

    背景 利用图卷积神经网络处理推荐系统的问题任然有很大局限性,即使是LightGCN也存在的问题,关于LightGCN的知识和原理实现可以参考我的另外几篇博客:链接 其局限性主要在于: (1)高度节点对 ...

  3. 推荐系统笔记:矩阵分解+基于邻居的模型

    由于其启发式性质,基于邻域的方法通常被认为与其他优化模型具有内在的不同. 尽管如此,结果表明基于邻域的方法也可以嵌入在其他优化模型的上下文中. 这是一个相当方便的框架,因为它为邻域模型与其他优化模型( ...

  4. 推荐系统笔记:基于矩阵分解(总结篇)

    推荐系统笔记:基于潜在因子模型的协同过滤(latent factor model)_UQI-LIUWJ的博客-CSDN博客 推荐系统笔记:无任何限制的矩阵分解_UQI-LIUWJ的博客-CSDN博客 ...

  5. 推荐系统笔记:基于非负矩阵分解的协同过滤

    1 非负矩阵分解 非负矩阵分解 (NMF) 可用于非负的评级矩阵. 这种方法的主要优势不一定是准确性,而是它在理解用户-项目交互方面提供的高度可解释性. 与其他形式的矩阵分解的主要区别在于因子 U 和 ...

  6. 推荐系统笔记:基于SVD的协同过滤

    1 奇异值分解 奇异值分解(SVD)是矩阵分解的一种形式,其中U和V的列被约束为相互正交 相互正交的优点是概念之间可以完全独立,并且可以用散点几何解释它们. 然而,这种分解的语义解释通常比较困难,因为 ...

  7. 推荐系统笔记:基于模型的协同过滤

    1 介绍 基于邻域的协同过滤方法可以看作是机器学习中常用的k-最近邻分类器KNN的泛化. 这些方法是基于实例的方法,因此,除了可选的预处理阶段之外,没有专门为预测预先创建模型. 推荐系统笔记:Intr ...

  8. 推荐系统笔记:决策树回归树

    决策树和回归树经常用于数据分类. 决策树是为那些因变量(target,label)是分类的情况而设计的,而回归树是为那些因变量(target,label)是数值的情况而设计的.          在讨 ...

  9. 深度学习笔记(46) 深度卷积网络学习

    深度学习笔记(46) 深度卷积网络学习 1. 学习内容 2. 第一层 3. 第二层 4. 第三层 5. 第四层 6. 第五层 1. 学习内容 深度卷积网络到底在学什么? 来看一个例子,假如训练了一个卷 ...

最新文章

  1. InnoDB体系结构
  2. 2016_6_27日报
  3. checkbox全选衍生问题讨论
  4. 替代触发器如何加判断 条件_《小逻辑》:如何设定目标,制定计划,做出更好的选择...
  5. PHP中插件机制的一种实现方案
  6. 专注计算机专业知识讲授,计算机一级考试MS Office上机指导
  7. c语言编写面条排序算法,腾讯PCG事业部腾讯视频面经
  8. 字典生成工具 -- pydictor
  9. 服务器cpu天梯图_2019年CPU单核跑分天梯图
  10. 项目经理的文档提升能力
  11. 爬取电影天堂最新电影的名称和下载链接(增量爬取mysql存储版)
  12. TSW(Tencent Server Web)源码阅读指南
  13. cad隐藏图层命令快捷键_Auto CAD如何快速隐藏图层,快捷键是什么?
  14. SIR SIRE 传染病预测模型与代码应用之概念篇
  15. Integer 用 == 比较时 127 相等 128 不相等
  16. ipad4使用教程 ipad mini使用技巧
  17. 国产化适配之人大金仓数据库(二)数据迁移
  18. Ubuntu 16.04下配置openWRT开发环境
  19. 外贸crm客户管理系统有什么优势和特点
  20. 微信公众帐号开发教程第2篇-微信公众帐号的类型(普通和会议)

热门文章

  1. linux安装新字体的方法
  2. 厦门日报:猜画小歌的纠错助手来自厦门
  3. FreeMarker 自定义 TemplateDirectiveModel(一)
  4. 人工智能如何赋能业务创新?安克创新有话要说
  5. HDU1533 Going Home
  6. 在Linux上安装Gearman及配置使用Gearman的PHP扩展环境
  7. 诺基亚安卓手机_诺基亚五摄手机来袭:OLED屏+屏幕指纹+安卓9.0,超越华为?
  8. css和css3的区别
  9. JavaScript 延迟执行,定时器的学习 clearTimeout ,setTimeout
  10. “物联世界,共创未来”2017世界物联网博览会在无锡启幕