Structural Deep Clustering Network


整个模型大概包括三部分:深度神经网络模块图卷积模块双重自监督模块
这篇文章写的是聚类算法,但是值得学习的是:它利用传输因子将深度神经网络模块和卷积模块融合

深度神经网络模块主要是利用自编码器学习数据自身的特性,损失函数为解码器的重构数据和原始数据之间的误差:

图卷积模块主要是将图卷积层学到的GCN特定表征和自编码器学到的特征表征进行结合,然后通过在KNN图上进行传播学习到结构信息。

与标准图卷积层不同,我们的图卷积模块为了同时学习到GCN的表征和自编码器的表征,引入了一个传递算子,它将两个表征进行加权求和:

双重自监督模块主要有两个作用,一是引入聚类信息来指导模型学习更好的数据表征;二是指导深度神经网络模块和图卷积模块的更新。具体来说,对于自编码器学到的数据xi的表征hi,我们利用Student’s t分布作一个核来衡量数据表征xi和聚类中心uj的相似性:

在获得聚类分布Q之后,我们想要引入聚类信息来指导模型学习更好的数据表征,具体来说,我们想要让数据表征更紧密的围绕在数据中心周围,以此来提高聚类结果的内聚性,为此我们设计了目标分布P:

引入KL散度作为损失函数来进行优化:

通过最小化Q分布和P分布之间的KL散度,Q分布会逐渐向P分布靠近,以此来达到提升聚类结果的内聚度的效果。

对于图卷积模块的训练,一种较为直观地方式是将聚类的结果作为真实标签进行分类训练,然而,这种策略会带来噪声和平凡解,并导致整个模型的崩溃。受到聚类损失函数的启发,我们将目标分布P作为监督信息来指导分布Z的更新:

该目标函数有两个优点:(1)与传统的多分类损失函数相比,KL散度以更“温和”的方式更新整个模型,以防止数据表征受到严重干扰;(2)图卷积模块和深度神经网络模块统一在同一优化目标中,使其两个模块的结果在训练过程中趋向于一致。因为深度神经网络模块和图卷积模块的目标是近似目标分布P,而且两个模块之间有很强的关系,所以我们称之为双重自监督机制。
整个模型的整体损失函数为:

α是平衡原始数据聚类优化和局部结构保存的超参数,β是控制图卷积模块对嵌入空间干扰的系数。通过对这个损失函数的优化,我们可以以端到端的方式更新整个模型。

备注:参考https://zhuanlan.zhihu.com/p/107648120

Structural Deep Clustering Network相关推荐

  1. Structural Deep Clustering Network阅读与翻译

    文章作者信息: Structural Deep Clustering Network 结构化深度聚类网络 深度聚类算法SDCN,首次将GNN用到聚类上,由北邮.腾讯和清华联合发表在WWW2020上. ...

  2. Structural Deep Clustering Network 基于GNN的深度聚类算法 WWW2020

    论文链接:https://arxiv.org/abs/2002.01633 代码与数据集链接:https://github.com/lxk-yb/SDCN 摘要 聚类是数据分析中一个基础任务.最近,深 ...

  3. 文献学习(part14)--Structural Deep Network Embedding

    学习笔记,仅供参考,有错必纠 文章目录 Structural Deep Network Embedding ABSTRACT INTRODUCTION RELATED WORK Deep Neural ...

  4. 【论文阅读|深读】SDNE:Structural Deep Network Embedding

    目录 前言 ABSTRACT 1. INTRODUCTION 2. RELATED WORK 2.1 Deep Neural Network 2.2 Network Embedding 3. STRU ...

  5. Structural Deep Embedding for Hyper-Networks

    Structural Deep Embedding for Hyper-Networks 基本信息 博客贡献人 垂杨柳 作者 Haoyu Wang, Defu Lian*, Yong Ge [重要作者 ...

  6. DKN: Deep Knowledge-Aware Network for News Recommendation阅读笔记

    这篇论文发表在2018年的WWW上.引入知识来进行新闻推荐. 关键词:News recommendation; knowledge graph representation; deep neural ...

  7. 【论文阅读|深读】DRNE:Deep Recursive Network Embedding with Regular Equivalence

    目录 前言 ABSTRACT 1 INTRODUCTION 2 RELATED WORK 3 DEEP RECURSIVE NETWORK EMBEDDING 3.1 Notations and De ...

  8. 异质网络表示--Structural Deep Embedding for Hyper-Networks

    [Structural Deep Embedding for Hyper-Networks](https://arxiv.org/abs/1711.10146) 是在hyperedge(超边是不可分解 ...

  9. 7.Deep Interest Network for Click-Through Rate Prediction论文详解

    一.总述 这是2018年阿里Guorui Zhou等人发表在KDD上的一篇论文.论文提出在CTR任务中,丰富的用户历史行为数据包含了用户多种兴趣,对于不同的候选广告,起作用的用户历史行为数据表示应该不 ...

最新文章

  1. B1054 求平均值 (20 分)
  2. 素数问题是物质的几何学问题
  3. Docker中运行命令时提示:Cannot connect to the Docker daemony...以及设置docker开机启动
  4. STL源码剖析 读书笔记一 2013-5-4
  5. eclipse 全屏插件
  6. 相位测试音频mp3_苹果AirPods MAX耳机音质一大短板在哪里?蓝牙AAC编码品质讨论与测试 「Soomal」...
  7. GPS各种地图坐标系转换(转载)
  8. Oracle中是用case...when语句进行判断
  9. 关于用C#编写ActiveX控件4(转)
  10. 学习OpenCV——OpenMP
  11. BP神经网络简单应用实例,bp神经网络的应用案例
  12. 非平衡电桥电阻计算_详解用非平衡电桥如何测量电阻
  13. 新版游戏陪玩约玩APP源码 多人连麦聊天/语音直播社交双端APP源代码 附搭建教程文档
  14. Live800:企业必修课|新时代的全渠道营销解析(下)
  15. JSP中文乱码解决方案了解和TOMCAT中文乱码解决
  16. 计算机网络英文简称汇总
  17. catia v5r21保姆级下载安装教程
  18. 文章:叶绿体 rRNA 甲基转移酶 CMAL 在核糖体形成和植物发育中的关键作用
  19. 空腹喝牛奶 解密食品不能空腹吃的传言
  20. 【代码质量的重要性:如何编写具有高质量标准的代码】

热门文章

  1. flash小游戏在Kongregate上线——BasketBall Master(篮球大师)
  2. 《MySQL必修课:存储引擎大揭秘!InnoDB和MyISAM究竟谁更强?》
  3. 华为手机安装英文TTS
  4. 史上最全Java工程师面试题汇总,全会月薪至少3W
  5. 虚幻4 动画系统概述
  6. Android GridView实现横向滚动
  7. matlab怎么把音频变成信号_如何利用matlab处理音频信号
  8. Python-scapy(白帽)[ARP无法欺骗手机吗][DNS欺骗不了https吗]
  9. 选择计算机配件用户需求,电脑配件篇(1)如何根据需求选择合适自己的CPU?...
  10. 长铗言论节选(自2017年5月以来)