网络的主旨(motifs)和结构规则

嘛,核心思想是,网络往往存在大量的重复结构,而如何度量某个结构在网络中的重要性,这边用了motifs来表述。

首先考虑每一个子图,可以用一个特征向量来对这些子图进行表述,而不同的特征模型,这个子图特征向量具备不同的值,而对于同一个种类的网络,如语言中的英语,法语,这个特征向量却是相似的。

大纲就是这个,首先是motifs和graphlets的定义,motifs就可以理解为小的,频繁出现的,显著结构的子结构,可以帮助我们理解网络运行原理以及预测网络在特定条件下的反应,注意最后两张motifs诱导子图的概念,以及允许重叠

motifs的显著性,指motifs在真实网络中出现频率远远高于(或者低于,都有意义)随机网络,可以用SP表述,计算如下

那么,我们现在需要生产一个随机图,degree序列与实际模型完全一致,核心就是随机配对。而如果用排序以避免自环/双边的情况,约束会越来越严格,就不是一个随机图了。

而作为替代,有一个switching的方法,从给定的图开始,随机交换两条边,如果交换数量足够多,也会得到随机图。当然这样效率会很低,但是degree会保持不变,实际上用第一种效率高得多,在节点足够多的时候自环和双边很少。一般随机图需要至少十张以上才能得到一个较为准确的标准差,取决于图本身大小。

motifs是对整个图提取信息,而Graphlets则是对某个节点提取周围的信息,graphlets 是一系列连通的非同构子图,这里要求是导出子图,即 induced。子结构随结点数目分分钟爆炸,因此引入了GDV的概念,用小的子结构描述大的子结构。(由于induced约束,图三的d不会出现4次,有2次都从属于b)

统计了节点数从 2到 5 的 graphlets 后我们能得到一个长度为 73 的 GDV 向量来表示一个节点周围的结构信息,而这个信息覆盖了以该节点为中心 4 个 hops 内的区域。

那么如何找到motifs和graphlets,一本只有枚举法和counting这两种,这里介绍ESU算法

附带的同构图的定义

第二部分重点来了,结构的角色,前边一堆花里胡哨的都是为了这个服务,不同节点对应不同角色,也拥有不同的表述方式。community感觉是聚类。

那么为毛role很重要,这个回答如下,引出了我们的角色搜索算法RoIX,核心是提取信息之后聚类,核心就是提取信息这一步

CS224W note 3相关推荐

  1. CS224W note 2

    按惯例我不翻资料只能听懂第一次课系列. 世界上任意两个人只用连接6次就可以达到系列 degree分布和图像的像素直方图分布用途应该相似,下边的都是图的一些基本属性的定义和计算,聚类系数这个只对无向图, ...

  2. 【CS224W】(task4/5)图嵌入表示学习(Deepwalk、Node2vec)更新中

    note Node embedding的基本框架:encoder+decoder 最简单encoder是embedding-lookup表:ENC(v)=zv=Z⋅v\mathrm{ENC}(v)=z ...

  3. 【CS224W】(task2)传统图机器学习和特征工程

    note 和CS224W课程对应,将图的基本表示写在task1笔记中了:传统图特征工程:将节点.边.图转为d维emb,将emb送入ML模型训练 Traditional ML Pipeline Hand ...

  4. 【CS224W】(task1)图机器学习导论

    note GNN应用场景:社交网络.知识图谱.复杂的文件系统等:节点.链路.子图分类任务等. 图机器学习的编程工具:(Graphgym.pyG.networkx.dgl.Pytorch.AntV.Ec ...

  5. 【CS224W】(task9)图神经网络的表示能力(GIN图同构模型)

    note ranking by discriminative power(input):sum-multiset > mean-distribution > max-set [基础部分]G ...

  6. 【CS224W】(task3)NetworkX工具包实践(地铁系统 | 城市交通)

    note networkx中的节点可以为任意可哈希的对象,比如字符串.图像.XML对象,甚至另一个Graph.自定义的节点对象.通过这种方式可以自由灵活地构建:图为节点.文件为节点.函数为节点,等灵活 ...

  7. 【CS224W】(task7)标签传播与节点分类(semi-supervised)

    note 对某一节点的标签进行预测,需要其本身特征.邻居的标签和特征.message passing的假设是图中相似的节点之间会存在链接,也就是相邻节点有标签相同的倾向.这种现象可以用homophil ...

  8. Paddle Release Note

    Paddle Release Note 重要更新 飞桨paddle框架2.0.0版本有如下重要更新: • 编程范式:默认开启动态图模式进行模型开发和训练,通过动转静的方式进行模型部署和训练加速.如果需 ...

  9. 机器学习与高维信息检索 - Note 7 - 核主成分分析(Kernel Principal Component Analysis,K-PCA)

    Note 7 - 核主成分分析(Kernel Principal Component Analysis) 核主成分分析 Note 7 - 核主成分分析(Kernel Principal Compone ...

最新文章

  1. 小技巧: 从开始菜单进行网络搜索
  2. 第十二届蓝桥杯大赛软件赛省赛第二场【C++B组】
  3. 启用Windows Server 2012的远程桌面
  4. php获取到的json数据如何处理_php – 如何从API获取JSON数据
  5. Java中的阻塞队列-LinkedBlockingQueue(二)
  6. UOJ#31 【UR #2】猪猪侠再战括号序列
  7. mysql查看日志命令_面对成百上千台服务器产生的日志,试试这款轻量级日志搬运神器!...
  8. 火狐浏览器快捷键大全
  9. NSString删除换行符号
  10. AWS服务器可以设置虚拟ip吗,《AWS云计算实战》3.使用虚拟服务器:EC2
  11. MAPX中的数据绑定问题
  12. iPad mini 6 评测:多功能升级,一手掌握的极佳手感,适合娱乐休闲
  13. steam使用技巧2
  14. 宝塔环境使用微软OneDrive云盘免费自动备份网站数据最佳方案!
  15. 陶陶摘苹果//C语言
  16. android 信息(mms)的故事(八)-- 彩信的解析
  17. 根据手机sim卡获取运营商信息
  18. java解析xml 前言中不允许有内容_关于xml加载提示: Error on line 1 of document : 前言中不允许有内容...
  19. 打造产业的“喀秋莎”(上)——什么是我们要的“事实标准”
  20. html右键滚轮不起作用,鼠标滚轮上下失灵处理方法 为什么鼠标滚轮不管用

热门文章

  1. 障碍滑雪比赛(Slalom,UVa 11627)
  2. 研发实时公交车的小程序,查公交用自己的
  3. Word排版时同时插入脚注和分栏的技巧总结
  4. 游戏玩的多,陪玩你了解的多吗?用Python来采集陪玩数据,看看行情和美照
  5. 达内 2019最新python(内容全)
  6. 帕累托最优(Pareto Optimality)
  7. qtQMouseEvent中的局部坐标pos()和全局坐标globalpos()
  8. win10安装docker教程、常见问题和原理总结
  9. 更新华为云跑jd脚本
  10. 4000 essential english words推荐学习