《IBM SPSS Modeler数据与文本挖掘实战》之社交网络分析
社交网络分析将关于关系的信息转换为字段,这些字段可描述个人和组的社交行为的特征。社交网络分析可识别影响网络中他人行为的社交领导。此外,可确定受其他网络参与者影响最大的个体。通过结合这些结果和其他测量,可创建个人的综合配置文件,作为预测模型的基础,包括此社交信息的模型比不包括的模型执行效果更好。
本章将首先介绍社交网络分析的基本知识,包括模型定义、模型应用、建模步骤和一些重要的模型注意事项,随后详细介绍在SPSS Modeler软件中使用社交网络分析的方法对电信行业潜在流失客户进行研究,并得出研究结论。
社交网络分析将有关人们之间关系的信息处理成字段,这些字段介绍社交网络中的个人角色,允许在预测模型中包括社交信息。
社交网络分析通过将关系信息处理为可包括在模型中的附加字段解决此问题。这些导出的关键绩效指标可衡量个人的社交特征。将这些社交属性与基于个人的衡量结合起来,可提高模型的预测精度。
下面简单介绍一下社交网络分析中的GA和DA两种算法的基本原理。假设我们拥有过去一年里某个地区的电话清单,数据量在百万到千万条左右,这些数据记录了拨号者和接收者,如图13-4所示。
- 根据共有邻接节点的数量,量化各个节点(也就是张三、李四、王五……)之间联系的强度。
- 保留高强度的联系,去除低强度的联系。执行此步骤后,社交网络会退化成几个内部联系多、外部联系少的次网络,以及很多孤立的节点。每个次网络对应一个群体,称为这个群体的核。
- 把那些孤立的节点连到距离他们最近的群体中去。在上一步中暂时去除的低强度的联系,在这一步发挥了主要作用。
- 对各个群体以及群体里的个体进行分析画像,例如评估群体内每个个体的地位,找出“领袖”、计算群体密度等,这些特性将用在后续应用中。
相比之下,DA的算法原理要更简单一些。DA不会将网络分成群体,而是在原网络上进行计算。DA着眼于计算一些人的行为对网络中其他人的冲击强度。
- 社交网络中的关系可分为方向或非方向。在方向关系中,会将一个人识别为关系的发起者,另一个人识别为接收者。例如,打电话是一种方向关系,一个人呼叫另一个人。同时源和目的地的角色不能定义为非方向关系,在这种情况下,双方都为均等参与关系,彼此交谈是非方向关系的一种实例。
- 重视关系包括指示关系强度的权重。该权重允许关系互相比较,“关系类型”表格按方向和尺度列出关系的交叉分类实例。例如在方向关系中,Joe是关系的源,Mary是目的地。在非方向关系中,不会指示关系的发起人。
详细内容请参考《IBM SPSS Modeler数据与文本挖掘实战》中的相关章节的内容。
《IBM SPSS Modeler数据与文本挖掘实战》之社交网络分析相关推荐
- 《IBM SPSS Modeler数据与文本挖掘实战》之文本挖掘算法
随着文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.现代文本分类和聚类领域面临巨大的挑战,而且随着学者研究的不断深入,其中的一些深层次问题也逐渐暴露出来,一些问题也已经成为本学科进一 ...
- 《IBM SPSS Modeler数据与文本挖掘实战》之常用数据挖掘软件
根据数据挖掘软件的开发目的和用途,一般可以分为专业型和通用型两种.专业型数据挖掘软件一般是针对某个特定领域的问题提供解决方案,在设计算法的时候充分考虑到数据的规模.类型以及研究者的需求等特点,并作了优 ...
- IBM SPSS Modeler数据库内建模
IBM SPSS Modeler Server支持对数据库供应商的数据挖掘工具和建模工具进行整合,其中包括IBM Netezza.IBM DB2 InfoSphere Warehouse.Oracle ...
- php 集成 spss,〖SPSS Modeler〗 IBM SPSS Modeler 整合不同数据库之间的数据
来自IBM DEVELOPERWORKS 简介 由于目前企业客户的业务量和数据量都在不断的提高,随着企业的发展,很多企业的数据存储都不局限于同一个数据库上,如果要对这些存储在不同数据库上的数据进行处理 ...
- IBM SPSS Modeler通过数据挖掘我们能从股市数据得到什么
众所周知,在证券投资领域将涉及很多数据,因此,通过简单的处理难以有效地分析各种公司股票之间的关系,而关联规则挖掘可以很好的解决这个问题,它允许投资在大量数据中,发现企业股票的相关性,以进一步研究和分析 ...
- SPSS Modeler 数据定义(指南 第二章)
关于SPSS Modeler 中的数据规则: 排列规则:一行一记录(对象),一列一指标(变量). 变量的属性:存储类型.测量级别和角色. 1. 存储类型 存储类型表示变量在计算机中的存储方式. 例如, ...
- 非常值得收藏的 IBM SPSS Modeler 算法简介
IBM SPSS Modeler以图形化的界面.简单的拖拽方式来快速构建数据挖掘分析模型著称,它提供了完整的统计挖掘功能,包括来自于统计学.机器学习.人工智能等方面的分析算法和数据模型,包括如关联.分 ...
- IBM SPSS Modeler使用技巧 ----参数及全局变量的使用
在使用IBM SPSS Modeler过程中,有一些小技巧可能容易被大家忽略,而它们却是可以帮助我们更加高效.方便地实现我们需要的功能,今天给大家介绍参数及全局变量的使用. 什么时候需要用到参数? 在 ...
- IBM SPSS Modeler 【1】 K均值聚类
一.聚类分析 在数据挖掘中,聚类分析关注的内容是一些相似的对象按照不同种类的度量构造成的群体.聚类分析的目标就是在相似的基础上对数据进行分类. IBM SPSS Modeler 提供了多种聚类分析模型 ...
- 使用IBM SPSS Modeler进行随机森林算法预测
IBM SPSS产品系列最主要的两款软件为IBM SPSS Statistics和IBM SPSS Modeler. IBM SPSS Statistics主要用于统计分析,如均值比较.方差分析.相关 ...
最新文章
- JQuery中html()和val()的用法区别
- 关于Installshield里一些常见问题的解答—艾泽拉斯之海洋女神出品
- jmp指令对应的机器码
- C++中逗号操作符重载的分析
- 使用SAP云平台portal service之前,需要做好哪些准备
- c#二叉树 取叶子节点个数_二叉树的最小深度+完全二叉树的节点个数
- windows下揪出java程序占用cpu很高的线程
- oracle左连接没用_一周零基础学完Oracle数据库第三天02
- ios自定义UITextView 支持placeholder的方法
- Java文件编码格式转换
- android开发学习笔记系列(6)--代码规范
- 微信小程序wx.navigateTo无法跳转
- 联想服务器怎么备份系统软件,联想电脑管家备份电脑驱动程序教程
- windows如何根据句柄hwnd显示和隐藏窗口
- 根据城市的名称获取省份的名称
- httpclient
- Excel 将两列合并变成第三列,中间加一个连字符
- jQuery Mobile 列表视图
- 数据库SQL习题练习Day4
- 突然发现高中时候的“概率”老师都讲的太复杂了