网络中节点特征的获取方法
DeepWalk
(借鉴自NLP中的word2vec,使用了随机游走的方法)
出自《DeepWalk: Online Learning of Social Representations》该论文,本文提出了一种网络嵌入的方法叫DeepWalk,它的输入是一张图或者网络,输出为网络中顶点的向量表示。DeepWalk通过截断随机游走(truncated random walk)学习出一个网络的社会表示(social representation),在网络标注顶点很少的情况也能得到比较好的效果。并且该方法还具有可扩展的优点,能够适应网络的变化。
算法描述:对图G,随机采样1个节点v,然后以此为起点连续采样,直到达到最大路径长度t,再通过Skip-gram来更新参数
DeepWalk2
(Node2Vector,在DeepWalk的基础上进行了改良)
出自论文《node2vec: Scalable Feature Learning for Networks》,文中首先提出了网络节点间游走(采样)的两种方式:Breadth-first Sampling(BFS)和Depth-first Sampling(DFS),其实有点类似常说的广搜和深搜,不同于DeepWalk中的随机选择,文章结合了BFS和DFS计算当前节点到下一个应去节点的概率。也由于这种游走方式的复杂性,在网络节点的个数较少时,node2vec的效果整体上要优于deepwalk,但在节点多到可能影响空间限制时,deepwalk效果更优。
图特征构建节点特征
该方法出自《Mining protein networks for synthetic genetic interactions》,该文章整合了节点在图上的图特征构建节点特征向量,图特征包括:Degree、Clustering coefficient、Closeness centrality、Normalized betweenness centrality等等。具体的图特征的计算方法可以查看论文。
SDNE
出自论文《Structural Deep Network Embedding》,在auto-encoder的基础上,使用二阶邻近关系被无监督学习用来捕获全局的网络结构,一阶邻近关系使用监督学习来保留网络的局部结构。利用多层非线性函数的组成将数据映射到高度非线性的潜在空间。
MASHUP
出自论文《Compact Integration of Multi-Network Topology for Functional Analysis of Genes》,该文章的创新点在于整合不同的异构网络,获得更精确的节点特征表达。首先,利用带重启的随机游走计算每个网络中每个节点的扩散表示,该扩散表示用于表示该节点与网络中各个其它节点的相关性。然后通过构造模型来近似这些扩散表示的分布,通过每个节点的低维特征向量进行参数化,同时最小化该模型的损失和扩散表示之间的差异来获得最终的特征向量。
Mashup最终得到的特征可以直接用于机器学习的分类任务。Mashup代码及已计算出的特征向量。方法图:
网络中节点特征的获取方法相关推荐
- 一种网络用户行为日志自动获取方法
摘要 本发明公开了一种网络用户行为日志自动获取方法,其特征在于:在客户端与Web服务器之间加上一代理服务器,代理服务器第一次接受Web服务器返回的响应正文为HTML格式的用户响应即HTTP响应,在该H ...
- 机器学习中的特征——特征选择的方法以及注意点
机器学习中的特征--特征选择的方法以及注意点 https://blog.csdn.net/google19890102/article/details/40019271 关于机器学习中的特征我有话要说 ...
- xpath的数据和节点类型以及XPath中节点匹配的基本方法
XPath数据类型 XPath可分为四种数据类型: 节点集(node-set) 节点集是通过路径匹配返回的符合条件的一组节点的集合.其它类型的数据不能转换为节点集. 布尔值(boolean) ...
- 复杂网络中节点重要性方面的研究热点问题
1.节点重要性的定义. 节点的重要性含义不同,评价节点重要性排名的结果也不同. 例如2012 年,美国<福布斯>全球影响力人物排行榜, 美国总统奥巴马成为2012 年度全球最具影响力人物, ...
- 复杂网络中衡量网络中节点中心性的几种度量指标
1.Degree Centrality(度中心性) 1.1 定义 度中心性(Degree Centrality)是在网络分析中刻画节点中心性(Centrality)的最直接度量指标.一个节点的节点度越 ...
- P2P网络中内网穿透的方法总结(2019)
P2P网络中内网穿越方法总结(2019) 内网穿越的需求 问题分析 方案一 方案二 方案三 内网穿越的需求 今天去图书馆搜资料查了一下,这个问题很老,但是解决办法很久都没有更新过了,还得翻翻书.网上的 ...
- js中Dom元素及获取方法
DOM基础对象 document document.documentElement html部分 document.head document.title document.body body部分 ...
- php中节点值怎么获取,php – 节点更新:获取旧值
我正在使用nodeapi更新更新节点,但是我需要在幕后进行更多操作,这需要我知道字段的旧值/是否有一种方法可以在覆盖之前获取字段的旧值. 最佳答案 编辑 hook_nodeapi()只对新的$node ...
- 网络中常用的队列管理方法比较
队列管理属于链路IP层的拥塞控制策略,主要是在路由器中采用排队算法和数据包丢弃策略.排队算法通过决定哪些包可以传输来分配带宽,而丢弃策略通过决定哪些包被丢弃来分配缓存. 1.先进先出(FIFO,Fir ...
最新文章
- 百度编辑器(1.4.3—net版)上传图片路径及其他配置
- 7-5 符号配对 (20 分)
- Process monitor词汇汉化
- java hashmap 缓存
- SAP Cloud for Customer客户主数据的classification
- Oracle中sys和system的区别
- qt linux 添加库文件路径,linux下qt使用第三方库的那些事
- javascript一些底层方法总结及用法
- android git项目管理,Android Studio中如何使用Git和Github来管理项目
- 使用OWC 做图表时按周、月、年设置时间刻度是参数无效问题解决方法
- 第三季-第22课-网络协议分析
- StretchDIBits函数显示图片
- 【数据结构 严蔚敏版】 循环队列 基本操作
- 爱立信实习生面试小结
- 使用Battery Historian采集android耗电数据
- RPLIDAR A2 Windows 下开发
- 多线程基础之设计模式Guarded Suspension模式
- Html img显示图片的三种方式
- FlinkSql中表的创建及查询
- linux——tail
热门文章
- ajax小练习-BMI网页计算器
- 计算圆面上的点到圆心的距离
- Python NLP初识-小试牛刀
- 计算机二级c语言作弊技巧,计算机等考成功心得:我这样考过二级C语言(1)
- 浅谈图像处理方向的就业前景
- 【自然语言处理】【大模型】大语言模型BLOOM推理工具测试
- 主要ZigBee芯片供应商ZigBee方案竞争能力比较
- 服务器常见问题汇总(常见故障及相应的解决方法入口)
- 开源项目:DRR(deepstream-ros-robot),针对pc主机端和nvidia-jetson边缘计算平台,实现了基于deepstream框架下的目标分类检测、车道线检测等,并配置了目标追踪
- 开始支持鸿蒙系统的设备,速来围观:华为鸿蒙操作系统2.0支持的设备清单流出...