spss相关性分析_关公配赤兔——因子分析和SPSS
一、准备
第1步:把“全班成绩”复制到SPSS的【数据视图】,如下图左侧:
5列分别对应所有五门考试成绩,26行分别代表全班26位同学。还记得学霸A和学渣B吗?就在第1行和第2行。第2步:在【变量视图】的【标签】列输入五门考试名称,如上图右侧。
二、分析
第3步:选择【分析】-【降维】-【因子】,打开因子分析主对话框,将【语文】、【数学】、【英语】、【历史】、【物理】移入右侧的“变量”区,以便进行分析:
主对话框是“本剧的女主角”,后面我们会“分手”四次,也会“重逢”四次,并最终在她这里say I do(按下【确认】键),因此请你牢牢记住她。四次“离合”(第4、5、6、7步)将分别打开和关闭描述对话框、提取对话框、旋转对话框和因子得分对话框,如下图:
剧情开始……第4步:在主对话框单击【描述】,出现描述对话框:
勾选【单变量描述】,输出观察变量x(每门考试成绩)的均值、标准差和样本量;
默认【初始解】,输出观察变量x(每门考试成绩)的公因子方差、与观察变量数目相同的公因子(主成分)、各公因子的特征值及其所占总方差的百分比和累计百分比;
勾选【系数】和【显著性水平】,输出观察变量x(每门考试成绩)的相关系数矩阵及其检验的P值;
勾选【KMO和Bartlett的球形检验】,将会输出KMO值和Bartlett球形检验的P值;
点击【继续】返回主对话框。
第5步:在主对话框单击【提取】,出现提取对话框:
“方法”默认【主成分】;
“分析”区默认【相关性矩阵】;
“显示”区默认【未旋转的因子解】,可以同时勾选【碎石图】;
“提取”区默认【基于特征值】且特征值大于【1】;
点击【继续】返回主对话框。
第6步:在主对话框单击【旋转】,出现旋转对话框:
“方法”区选择【最大方差法】;
“输出”区会自动勾选【旋转后的解】;
点击【继续】返回主对话框。
第7步:在主对话框单击【得分】,出现因子得分对话框:
勾选【保存为变量】,将会把提取出的因子得分f值保存为新的变量,自动列在前面的【数据视图】和【变量视图】里;
“方法”区默认【回归】;
勾选【显示因子得分系数矩阵】;
点击【继续】返回主对话框。
最后,深吸一后气,在主对话框郑重按下【确认】。
三、解读
奇迹发生了!!!出来一堆孩子,哦不,一堆表格……
from描述对话框
描述统计 |
|||
平均值 |
标准偏差 |
分析个案数 |
|
语文 |
77.6154 |
20.91521 |
26 |
数学 |
72.6538 |
22.31760 |
26 |
英语 |
75.0000 |
22.09072 |
26 |
历史 |
80.5000 |
21.85452 |
26 |
物理 |
70.5000 |
23.88347 |
26 |
平均值和标准差,我们太熟悉了。如果还有问题,请重温此公众号2017年5月16日文章《数据的“身材”与“三围”》。
相关性矩阵 |
||||||
语文 |
数学 |
英语 |
历史 |
物理 |
||
相关性 |
语文 |
1.000 |
.275 |
.966 |
.983 |
.221 |
数学 |
.275 |
1.000 |
.200 |
.215 |
.974 |
|
英语 |
.966 |
.200 |
1.000 |
.963 |
.158 |
|
历史 |
.983 |
.215 |
.963 |
1.000 |
.162 |
|
物理 |
.221 |
.974 |
.158 |
.162 |
1.000 |
|
显著性 (单尾) |
语文 |
.087 |
.000 |
.000 |
.139 |
|
数学 |
.087 |
.164 |
.146 |
.000 |
||
英语 |
.000 |
.164 |
.000 |
.221 |
||
历史 |
.000 |
.146 |
.000 |
.215 |
||
物理 |
.139 |
.000 |
.221 |
.215 |
相关系数也很熟悉,如果有问题,请参考2017年9月23日文章《变量关系大揭秘(一)》。此处仅举个例子,从结果可以看出,语文和数学的相关系数是0.275,线性关系比较弱。
KMO 和巴特利特检验 |
||
KMO 取样适切性量数。 |
.681 |
|
巴特利特球形度检验 |
近似卡方 |
211.896 |
自由度 |
10 |
|
显著性 |
.000 |
观察变量(五门考试成绩)是否存在相关性,是我们能否提取公因子(文科能力和理科能力)的前提;
(1)KMO值用于检验各科成绩之间相关性强弱,取值在0-1之间,越大越好,当KMO<0.5,一般不宜做因子分析;(2)Bartlett球形检验的P值,也是用于检验五门考试成绩的独立性(不相关),P值越小越好,当P>0.05,一般不宜做因子分析;(3)从输出结果看,两个指标分别是0.681和0.000,Very Good!
公因子方差 |
||
初始 |
提取 |
|
语文 |
1.000 |
.988 |
数学 |
1.000 |
.987 |
英语 |
1.000 |
.973 |
历史 |
1.000 |
.984 |
物理 |
1.000 |
.987 |
提取方法:主成分分析法。 |
公因子方差也叫变量共同度,或者公共方差,反映全部公因子能够解释某个观察变量变化的比例,比如对于语文成绩的变化,文科能力和理科能力联合起来可以解释98.8%(好厉害!)。实际操作中,尽量不要低于0.5。
总方差解释 |
|||||||||
成分 |
初始特征值 |
提取载荷平方和 |
旋转载荷平方和 |
||||||
总计 |
方差百分比 |
累积 % |
总计 |
方差百分比 |
累积 % |
总计 |
方差百分比 |
累积 % |
|
1 |
3.156 |
63.124 |
63.124 |
3.156 |
63.124 |
63.124 |
2.931 |
58.630 |
58.630 |
2 |
1.763 |
35.255 |
98.379 |
1.763 |
35.255 |
98.379 |
1.987 |
39.749 |
98.379 |
3 |
.043 |
.868 |
99.247 |
||||||
4 |
.023 |
.461 |
99.708 |
||||||
5 |
.015 |
.292 |
100.000 |
||||||
提取方法:主成分分析法。 |
每个公共因子对应一个特征值,特征值能反映这个公因子的重要性,即它“抵得上”几个观察变量。从输出结果看,第一个公因子很厉害,以1当3.156;第二个也不赖,能以1当1.763;第三个公因子就差点劲了,以1当0.043,往后越来越差。我们一般只留下特征值大于1的公因子,此例中留前两个。
每个公因子对应一个方差百分比,代表这个公因子的贡献,即它单独能解释所有观察变量变化的比重。如果把两个公因子的方差百分比累加起来,就得到累积百分比,能够代表这两个公因子联合起来能解释所有观察变量变化的百分比。此例中,我们看到,前两个公因子的累积百分比高达99.379%。
from提取对话框
竖轴是特征值,横轴是按特征值从大到小排列的公因子。此图可以更形象的反映出特征值的变化,方便我们决定保留到第几个公因子。
成分矩阵a |
||
成分 |
||
1 |
2 |
|
语文 |
.960 |
-.259 |
数学 |
.514 |
.850 |
英语 |
.931 |
-.324 |
历史 |
.940 |
-.317 |
物理 |
.469 |
.876 |
提取方法:主成分分析法。 |
||
a. 提取了 2 个成分。 |
成分矩阵也叫因子载荷矩阵,就是我们关心的系数a。举个例子,从输出结果可知:
这两个公因子真是文科能力和理科能力吗?
根据原始数据(五门成绩x),SPSS其实可以“凑”出无数组a,当然也就有无数组公因子f。上面只是其中一组a,它对应的两个公因子f1和f2,跟我们心目中的文科能力和理科能力,显然还有些距离。别着急,SPSS还会“整容”——坐标系旋转。保证在你转晕之前,自动给出你最满意的公因子。
from旋转对话框
旋转后的成分矩阵a |
||
成分 |
||
1 |
2 |
|
语文 |
.983 |
.148 |
数学 |
.130 |
.985 |
英语 |
.983 |
.077 |
历史 |
.988 |
.087 |
物理 |
.078 |
.991 |
提取方法:主成分分析法。 旋转方法:凯撒正态化最大方差法。 |
||
a. 旋转在 3 次迭代后已收敛。 |
看到了吧,这回行了。每门考试x对应的两个因子载荷a(方程系数)都是一大一小。还记得a代表公因子f的重要性吗?这才是文科能力和理科能力啊!翻译出来就是:
from因子得分对话框
成分得分系数矩阵 |
||
成分 |
||
1 |
2 |
|
语文 |
.337 |
-.012 |
数学 |
-.044 |
.507 |
英语 |
.344 |
-.050 |
历史 |
.345 |
-.045 |
物理 |
-.063 |
.515 |
提取方法:主成分分析法。 旋转方法:凯撒正态化最大方差法。 组件得分。 |
我们(哦不,是SPSS)从观察变量x值出发,历尽千辛万苦,终于求得一套满意的因子载荷a值。但别忘了,还有因子得分f值呢。因此SPSS贴心的给出另外一组系数,方便我们计算f值。上面输出结果可以翻译为:
根据这个公式,SPSS还附送了每一位同学的文科能力和理科能力得分,并自动放入第1步中的【数据视图】(多了两列分数)和【变量视图】(多了两个变量)。
最后,需要声明的是,为了剔除量纲影响和计算方便,SPSS处理所有变量的数值都采取了标准化的形式。
题外话
讲完了,我也累坏了。要知道,实际操作过程其实特简单,我算了一下,只需要你点25下鼠标。惊不惊喜意不意外!
spss相关性分析_关公配赤兔——因子分析和SPSS相关推荐
- 用spss做多组两两相关性分析_两独立样本T检验及如何利用SPSS实现其操作
上一篇文章我们讲解了有关单样本T检验的相关内容(如何使用SPSS进行单样本检验),其实论文中除了常用到的单样本T检验以外,还有另外一种T检验的方法也是经常用到的统计方法,也就是两独立样本T检验 说到T ...
- spss相关性分析看结果_利用spss做Pearson相关性分析步骤详解
有蛮多的学生私信老徐问如何利用spss做相关性分析,其实相关性分析应该是spss分析中较为基础的一个功能应用,很多学生可能是因为跨专业或者对统计软件了解较少,在没有经过系统学习的前提下,感觉云里雾里. ...
- spss相关性分析_SPSS有话说:如何得出问卷或量表的结构或维度——探索性因素分析...
导 语 为进一步明晰量表的结构模型并确定正式量表,除进行项目分析外,随后根据探索性因素分析的结果剔除预测量表中不合适的项目. SPSS有话说 基本概念: 探索性因素分析是依据样本数据,根据变量间相 ...
- spark 相关性分析_《Spark机器学习进阶实战》——2.3.2 相关性分析
2.3.2 相关性分析 相关性分析是指通过分析寻找不同商品或不同行为之间的关系,发现用户的习惯,计算两个数据集的相关性是统计中的常见操作. MLlib提供了计算多个数据集两两相关的方法.目前支持的相关 ...
- 多元相关性分析_初发儿童1型糖尿病患者甲状腺激素水平与糖脂代谢的相关性研究...
苏海燕 单小鸥 林康 姜晗丹 施林微 325000温州医科大学附属第二医院.育英儿童医院儿童内分泌遗传代谢科(苏海燕.单小鸥.姜晗丹),手显微外科(林康),儿童呼吸科(施林微) 糖尿病和甲状腺疾病是内 ...
- excel两个指标相关性分析_用EXCEL函数进行相关性分析
相关系数的定义: 相关系数最早源自教育研究中, 常涉及到两个事物 (变量) 的相互关系问题, 例 如, 学习成绩与非智力因素的关系, 数学成绩与物理成绩的关系, 男女生学习成 绩的关系,等等. 其关系 ...
- sklearn 相关性分析_人工智能和大数据的骨架支点—— 机器学习之相关性分析
内容架构: 第一部分:简单线性回归 第二部分:如何用逻辑回归分类 第三部分:kaggle和泰坦尼克号预测 第一部分:简单线性回归 一.机器学习(Machine Learning, ML) 是机器学习算 ...
- 基于c#的相关性分析_基于数字高程模型的城市地貌与地名相关性分析——以兰州市为例...
江西地名研究 基于数字高程模型的城市地貌与地名 相关性分析--以兰州市为例 文/张鹏丽,李育 提要:以兰州市为例,使用 ASTER 30米分辨率的数字高程模型DEM并提取了兰州市周边所有地名信息:通过 ...
- python 相关性分析_数据分析---用Python进行相关性分析(兼谈假设检验)
一.相关关系和相关系数 世上除了因果关系,还有相关关系. 有一个叫"相关系数"的指标来量化两个事物之间的相关程度. 其中相关系数用"r"表示,取值范围介于-1和 ...
- 多元相关性分析_电子健康素养与中青年脑卒中患者健康行为的相关性分析
电子健康素养与中青年脑卒中患者健康行为的相关性分析 戴春花 1, 王雪 1, 曾杏梅 1, 徐鹏翔 2, 冯基高 2 [ 摘要] 背景 近年来电子健康素养在慢性病患者的管理中受到广泛关注, 但目前关于 ...
最新文章
- Linq To select
- POJ - 2195 Going Home(二分图最小权匹配+KM+思维建边/最小费用最大流)
- Python 模块之 string.py
- 我的HTML总结之常用基础便签
- 线程下的udp和tcp局域网聊天
- 用sokit发送http请求和响应
- android文件读取文件内容,android创建txt文件,读取txt文件内容
- 如何用两个栈模拟实现一个队列
- 复杂知识图谱问答综述方法、挑战和解决办法
- 笔记本计算机内部部件,笔记本内部硬件构造有哪些
- linux的复制粘贴
- 数据可视化是什么,数据可视化怎么做最好?
- 万豪酒店集团5亿客户记录泄露
- Microsoft Office word 2019教程 - word中的excel表格随着excel表格的变化而变化
- 50个开机进BIOS按键查询
- wu版-天下无难试之Redis面试题刁难大全
- SODA理事会理事、苏打数据CEO高丰:只有数据流通,数据才能创造价值
- php http form的格式,multipart/form-data 格式的http请求,以及lua构造实现
- 计算机二级C语言100套题
- 百度ai 人脸识别 java_百度ai 接口 人脸识别
热门文章
- linux常用运行库,软件常用运行库-软件常用运行库scku下载 v3.1.0.0官方版--pc6下载站...
- 一个很好用的,免费的UML在线画图网站
- python linux 打印机,Python抓取打印机硒鼓和组件剩余量的爬虫
- SQL注入语法类型和sql盲注
- RS232和RS485标准在DB9公/母头上的接线定义
- Hypermesh-优化案例学习笔记-cclip
- PS插件:灯光工厂安装教程
- 读取excel数据,根据word模板生成word文件。【python】【word vba】两种方法
- 针式打印机设置字号大小
- c语言指针详解参数,C语言之指针详解