https://www.zhihu.com/question/338051122
https://www.zhihu.com/question/346942899
https://zhuanlan.zhihu.com/p/291230435

  1. GCN的缺点在于它灵活性差transductive,并且扩展性非常差,除此之外这篇论文借助验证集来早停帮助性能提升,跟它半监督学习的初衷有点相悖。训练是full-batch的,难以扩展到大规模网络,并且收敛较慢
  2. GraphSage论文旨在提升gcn扩展性和改进训练方法缺陷。它将模型目标定于学习一个聚合器而不是为每个节点学习到一个表示,这中思想可以提升模型的灵活性和泛化能力。除此之外,得益于灵活性,它可以分批训练提升收敛速度。但是它的问题是因为节点采样个数随层数指数增长,会造成模型在time per batch上表现很差,弱于GCN,这方面的详细讨论可以参考Cluster-GCN这篇论文。虽然支持mini-batch方式训练,但是训练较慢,固定邻居数目的node-wise采样,精度和效率较低。
  3. GAT这篇论文创新之处是加入attention机制,给节点之间的边给予重要性,帮助模型学习结构信息。相对的缺点就是训练方式不是很好,其实这个模型可以进一步改,用attention做排序来选取采样节点,这样效果和效率方面应该会有提升。参数量比GCN多,也是full-batch训练;只用到1-hop的邻居,没有利用高阶邻居,当利用2阶以上邻居,容易发生过度平滑(over-smoothing)

Problem:

  1. Why? gcn增加深度会降低模型效果
  • 数据集太小,overfitting的问题,在一些数据上training acc为100%的大概率是这个问题,需要通过防止过拟合的技术来解决

  • vanishing gradient,这是CNN里一样存在的问题,当层数太深导致网络的参数不能得到有效的训练。这个问题可以加skip connections可以有效解决

  • over smoothing同一个连通分量里的节点会收敛的一个值,一个解决的方法是通过有效地改变图的结构或卷积的领接节点来解决。比如在点云里用动态knn/dilation来建边,但在其他图数据,这个方法会丢失边的信息。

  • 主要解决方案:skip-connection: 残差网络

    • DeepGCNs: Can GCNs Gobas Deep as CNNs?

      • 这篇论文主要讨论了GCN的深度问题,文中用了ResGCN,DenseGCN和Dilation等方法,最后效果比较明显。网络层数可以达到56层,并且有3.7个点的提升。
    • Deep insights into Graph Convolution Networks for Semi-supervised Learning
      • 这篇论文只看前面对于过度平滑的分析即可。
    • Representation learning on graphs with jumping knowledge networks
      • 这篇论文建立一个相对比较深的网络,在网络的最后当一个层聚合器来从所有层的输出中进行选择,来抑制noise information的问题。

PS: 即便使用了残差连接,GCN也不可能做的太深,基本就是3-5层左右的样子。
- 这是因为GCN可以被看作低通滤波器,叠加低通滤波器具有明显的过度平滑现象。如果想要做的更深,可以考虑一下DropEdge的方法,通过在训练过程中随机扔掉一些边来缓解过度平滑的现象,这种方法最近被证明是有效的。
- 修正:在采用了BN层和residual连接时,gcn可以做很深。

GNN等优缺点总结及解决方案相关推荐

  1. 《深入理解分布式事务》第五章 强一致性分布式解决方案

    <深入理解分布式事务>第五章 强一致性分布式解决方案 文章目录 <深入理解分布式事务>第五章 强一致性分布式解决方案 一.强一致性事务概述 1.典型方案 2.适用场景 3.优缺 ...

  2. 2020年,图机器学习的趋势有哪些?

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 2020 年已经过去了2个多月,但我们已经可以从最近的研究论文中一窥图机器学习(G ...

  3. 图神经网络(AliGraph)在阿里巴巴的发展与应用

    2019-12-11 11:29:59 背景 为什么做GNN? 在大数据的背景下,利用高速计算机去发现数据中的规律似乎是最有效的手段.为了让机器计算的有目的性,需要将人的知识作为输入.我们先后经历了专 ...

  4. 为啥linux分区是nvme0n1,NAS 篇五:尝试达成最终目标: 黑裙+万兆网卡+Nvme 存储空间的实现与测试...

    NAS 篇五:尝试达成最终目标: 黑裙+万兆网卡+Nvme 存储空间的实现与测试 2020-01-18 18:49:23 46点赞 248收藏 80评论 创作立场声明:1. 本系列文章讨论NAS与局域 ...

  5. 2020年,图机器学习将走向何方?

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自机器之心. 选自towardsdatascience 作者:Sergei Ivanov 机器之心编译 参与:魔王.杜伟 2020 年已经过去了 ...

  6. 使用Microsoft SQL Server 2000全文搜索功能构建Web搜索应用程序 --作者:Andrew B. Cencini...

    [摘要]了解如何充分利用SQL Server 2000的全文搜索功能.本文包含有关实现最大吞吐量和最佳性能的几点提示和技巧. 概述 使用Microsoft© SQL Server 2000的全文搜索功 ...

  7. 机器学习面试问题汇总

    1监督与非监督区别 2L1L2区别 3生成模型和判别模型区别 像贝叶斯lda 等就是生成模型计算过概率分布之类的 1svm算法的原理如何组织训练数据如何调节惩罚因子如何防止过拟合svm的泛化能力增量学 ...

  8. 面试突击:什么是粘包和半包?怎么解决?

    粘包和半包问题是数据传输中比较常见的问题,所谓的粘包问题是指数据在传输时,在一条消息中读取到了另一条消息的部分数据,这种现象就叫做粘包.比如发送了两条消息,分别为"ABC"和&qu ...

  9. Android 今日头条适配详解

    这篇文章是在掘金上看到的,感觉不错.怕时间长了不好找,因此就转载过来,进行保存. 原文地址:https://juejin.cn/post/6844903661819133960  原文作者:JessY ...

最新文章

  1. 2022-2028年中国集装箱涂料行业市场研究及前瞻分析报告
  2. TCP和UDP基本原理
  3. jq 选择多个子元素,,添加,删除多个类
  4. 抖音微信之争的真相:地盘之争,还是用户隐私之争?
  5. JavaScript实现复选框全选与全不选的效果
  6. 安装openstack时遇到的错误
  7. “手把手教你学linux驱动开发”OK6410系列之03---LED字符设备驱动
  8. 单片机引脚复用使用不当会导致bug
  9. 卸载自己编译的程序(ubuntu14.04)
  10. (四) Session管理 --《springboot与shiro整合》
  11. MATLAB实现QPSK
  12. WIFI系列协议--802.11ac--增强非常高吞吐量简称VHT--1Gbit
  13. github 和git_Git和GitHub入门指南
  14. python最佳身高_Python+sklearn使用线性回归算法预测儿童身高
  15. redis 持久化和恢复
  16. 施工现场资料员15个常见问题处理流程!
  17. 安卓领域高质量公众号推荐
  18. 渗透测试工具-瑞士军刀NC
  19. mp4视频无法播放的解决方法
  20. 【数值溢出】从二进制的角度看数值溢出

热门文章

  1. Android中LauncherActivity、PreferenceActivity、ExpandableListActivity的综合运用
  2. 鲁大师2022年Q1手机流畅榜:Redmi K50电竞版最流畅
  3. 佛系少女计算机音乐,抖音短视频佛系少女歌曲介绍 完整歌词介绍
  4. 第四章 第七节:神奇的参数
  5. Origin作图数据点显示不全
  6. A Perfectly Balanced String? (Codeforces Round #785 (Div. 2))
  7. 因病或非因工死亡是否有丧葬补助金和抚恤金
  8. 祸起萧墙:由播放器引爆的全国性大规模挂马分析
  9. ExeShield Deluxe 1.41
  10. mysql-58同城30条军规