良将辅明主,宝马配英雄。就像关公离不开“赤兔”,因子分析如果想“日行千里、如履平地”,也需要赛(sai)跑(pao)神(shen)兽(shou),SPSS。就像每天的买菜-做饭-开吃,SPSS也可以分成三步:准备(数据)-分析(数据)-解读(结果)。

一、准备

第1步:把“全班成绩”复制到SPSS的【数据视图】,如下图左侧:

5列分别对应所有五门考试成绩,26行分别代表全班26位同学。还记得学霸A和学渣B吗?就在第1行和第2行。第2步:在【变量视图】的【标签】列输入五门考试名称,如上图右侧。

二、分析

第3步:选择【分析】-【降维】-【因子】,打开因子分析主对话框,将【语文】、【数学】、【英语】、【历史】、【物理】移入右侧的“变量”区,以便进行分析:

主对话框是“本剧的女主角”,后面我们会“分手”四次,也会“重逢”四次,并最终在她这里say I do(按下【确认】键),因此请你牢牢记住她。四次“离合”(第4、5、6、7步)将分别打开和关闭描述对话框、提取对话框、旋转对话框和因子得分对话框,如下图:

剧情开始……第4步:在主对话框单击【描述】,出现描述对话框:

  1. 勾选【单变量描述】,输出观察变量x(每门考试成绩)的均值、标准差和样本量;

  2. 默认【初始解】,输出观察变量x(每门考试成绩)的公因子方差、与观察变量数目相同的公因子(主成分)、各公因子的特征值及其所占总方差的百分比和累计百分比;

  3. 勾选【系数】和【显著性水平】,输出观察变量x(每门考试成绩)的相关系数矩阵及其检验的P值;

  4. 勾选【KMO和Bartlett的球形检验】,将会输出KMO值和Bartlett球形检验的P值;

  5. 点击【继续】返回主对话框。

第5步:在主对话框单击【提取】,出现提取对话框:

  1. “方法”默认【主成分】;

  2. “分析”区默认【相关性矩阵】;

  3. “显示”区默认【未旋转的因子解】,可以同时勾选【碎石图】;

  4. “提取”区默认【基于特征值】且特征值大于【1】;

  5. 点击【继续】返回主对话框。

第6步:在主对话框单击【旋转】,出现旋转对话框:

  1. “方法”区选择【最大方差法】;

  2. “输出”区会自动勾选【旋转后的解】;

  3. 点击【继续】返回主对话框。

第7步:在主对话框单击【得分】,出现因子得分对话框:

  1. 勾选【保存为变量】,将会把提取出的因子得分f值保存为新的变量,自动列在前面的【数据视图】和【变量视图】里;

  2. “方法”区默认【回归】;

  3. 勾选【显示因子得分系数矩阵】;

  4. 点击【继续】返回主对话框。

最后,深吸一后气,在主对话框郑重按下【确认】。

三、解读

奇迹发生了!!!出来一堆孩子,哦不,一堆表格……

from描述对话框

描述统计

平均值

标准偏差

分析个案数

语文

77.6154

20.91521

26

数学

72.6538

22.31760

26

英语

75.0000

22.09072

26

历史

80.5000

21.85452

26

物理

70.5000

23.88347

26

平均值和标准差,我们太熟悉了。如果还有问题,请重温此公众号2017年5月16日文章《数据的“身材”与“三围”》。

相关性矩阵

语文

数学

英语

历史

物理

相关性

语文

1.000

.275

.966

.983

.221

数学

.275

1.000

.200

.215

.974

英语

.966

.200

1.000

.963

.158

历史

.983

.215

.963

1.000

.162

物理

.221

.974

.158

.162

1.000

显著性 (单尾)

语文

.087

.000

.000

.139

数学

.087

.164

.146

.000

英语

.000

.164

.000

.221

历史

.000

.146

.000

.215

物理

.139

.000

.221

.215

相关系数也很熟悉,如果有问题,请参考2017年9月23日文章《变量关系大揭秘(一)》。此处仅举个例子,从结果可以看出,语文和数学的相关系数是0.275,线性关系比较弱。

KMO 和巴特利特检验

KMO 取样适切性量数。

.681

巴特利特球形度检验

近似卡方

211.896

自由度

10

显著性

.000

观察变量(五门考试成绩)是否存在相关性,是我们能否提取公因子(文科能力和理科能力)的前提;

(1)KMO值用于检验各科成绩之间相关性强弱,取值在0-1之间,越大越好,当KMO<0.5,一般不宜做因子分析;(2)Bartlett球形检验的P值,也是用于检验五门考试成绩的独立性(不相关),P值越小越好,当P>0.05,一般不宜做因子分析;(3)从输出结果看,两个指标分别是0.681和0.000,Very Good!

公因子方差

初始

提取

语文

1.000

.988

数学

1.000

.987

英语

1.000

.973

历史

1.000

.984

物理

1.000

.987

提取方法:主成分分析法。

公因子方差也叫变量共同,或者公共方差,反映全部公因子能够解释某个观察变量变化的比例,比如对于语文成绩的变化,文科能力和理科能力联合起来可以解释98.8%(好厉害!)。实际操作中,尽量不要低于0.5。

总方差解释

成分

初始特征值

提取载荷平方和

旋转载荷平方和

总计

方差百分比

累积 %

总计

方差百分比

累积 %

总计

方差百分比

累积 %

1

3.156

63.124

63.124

3.156

63.124

63.124

2.931

58.630

58.630

2

1.763

35.255

98.379

1.763

35.255

98.379

1.987

39.749

98.379

3

.043

.868

99.247

4

.023

.461

99.708

5

.015

.292

100.000

提取方法:主成分分析法。

每个公共因子对应一个特征值,特征值能反映这个公因子的重要性,即它“抵得上”几个观察变量。从输出结果看,第一个公因子很厉害,以1当3.156;第二个也不赖,能以1当1.763;第三个公因子就差点劲了,以1当0.043,往后越来越差。我们一般只留下特征值大于1的公因子,此例中留前两个。

每个公因子对应一个方差百分比,代表这个公因子的贡献,即它单独能解释所有观察变量变化的比重。如果把两个公因子的方差百分比累加起来,就得到累积百分比,能够代表这两个公因子联合起来能解释所有观察变量变化的百分比。此例中,我们看到,前两个公因子的累积百分比高达99.379%。

from提取对话框

竖轴是特征值,横轴是按特征值从大到小排列的公因子。此图可以更形象的反映出特征值的变化,方便我们决定保留到第几个公因子。

成分矩阵a

成分

1

2

语文

.960

-.259

数学

.514

.850

英语

.931

-.324

历史

.940

-.317

物理

.469

.876

提取方法:主成分分析法。

a. 提取了 2 个成分。

成分矩阵也叫因子载荷矩阵,就是我们关心的系数a。举个例子,从输出结果可知:

这两个公因子真是文科能力和理科能力吗?

根据原始数据(五门成绩x),SPSS其实可以“凑”出无数组a,当然也就有无数组公因子f。上面只是其中一组a,它对应的两个公因子f1和f2,跟我们心目中的文科能力和理科能力,显然还有些距离。别着急,SPSS还会“整容”——坐标系旋转。保证在你转晕之前,自动给出你最满意的公因子。

from旋转对话框

旋转后的成分矩阵a

成分

1

2

语文

.983

.148

数学

.130

.985

英语

.983

.077

历史

.988

.087

物理

.078

.991

提取方法:主成分分析法。

旋转方法:凯撒正态化最大方差法。

a. 旋转在 3 次迭代后已收敛。

看到了吧,这回行了。每门考试x对应的两个因子载荷a(方程系数)都是一大一小。还记得a代表公因子f的重要性吗?这才是文科能力和理科能力啊!翻译出来就是:

from因子得分对话框

成分得分系数矩阵

成分

1

2

语文

.337

-.012

数学

-.044

.507

英语

.344

-.050

历史

.345

-.045

物理

-.063

.515

提取方法:主成分分析法。

旋转方法:凯撒正态化最大方差法。

组件得分。

我们(哦不,是SPSS)从观察变量x值出发,历尽千辛万苦,终于求得一套满意的因子载荷a值。但别忘了,还有因子得分f值呢。因此SPSS贴心的给出另外一组系数,方便我们计算f值。上面输出结果可以翻译为:

根据这个公式,SPSS还附送了每一位同学的文科能力和理科能力得分,并自动放入第1步中的【数据视图】(多了两列分数)和【变量视图】(多了两个变量)。

最后,需要声明的是,为了剔除量纲影响和计算方便,SPSS处理所有变量的数值都采取了标准化的形式。

题外话

讲完了,我也累坏了。要知道,实际操作过程其实特简单,我算了一下,只需要你点25下鼠标。惊不惊喜意不意外!

spss相关性分析_关公配赤兔——因子分析和SPSS相关推荐

  1. 用spss做多组两两相关性分析_两独立样本T检验及如何利用SPSS实现其操作

    上一篇文章我们讲解了有关单样本T检验的相关内容(如何使用SPSS进行单样本检验),其实论文中除了常用到的单样本T检验以外,还有另外一种T检验的方法也是经常用到的统计方法,也就是两独立样本T检验 说到T ...

  2. spss相关性分析看结果_利用spss做Pearson相关性分析步骤详解

    有蛮多的学生私信老徐问如何利用spss做相关性分析,其实相关性分析应该是spss分析中较为基础的一个功能应用,很多学生可能是因为跨专业或者对统计软件了解较少,在没有经过系统学习的前提下,感觉云里雾里. ...

  3. spss相关性分析_SPSS有话说:如何得出问卷或量表的结构或维度——探索性因素分析...

    导   语 为进一步明晰量表的结构模型并确定正式量表,除进行项目分析外,随后根据探索性因素分析的结果剔除预测量表中不合适的项目. SPSS有话说 基本概念: 探索性因素分析是依据样本数据,根据变量间相 ...

  4. spark 相关性分析_《Spark机器学习进阶实战》——2.3.2 相关性分析

    2.3.2 相关性分析 相关性分析是指通过分析寻找不同商品或不同行为之间的关系,发现用户的习惯,计算两个数据集的相关性是统计中的常见操作. MLlib提供了计算多个数据集两两相关的方法.目前支持的相关 ...

  5. 多元相关性分析_初发儿童1型糖尿病患者甲状腺激素水平与糖脂代谢的相关性研究...

    苏海燕 单小鸥 林康 姜晗丹 施林微 325000温州医科大学附属第二医院.育英儿童医院儿童内分泌遗传代谢科(苏海燕.单小鸥.姜晗丹),手显微外科(林康),儿童呼吸科(施林微) 糖尿病和甲状腺疾病是内 ...

  6. excel两个指标相关性分析_用EXCEL函数进行相关性分析

    相关系数的定义: 相关系数最早源自教育研究中, 常涉及到两个事物 (变量) 的相互关系问题, 例 如, 学习成绩与非智力因素的关系, 数学成绩与物理成绩的关系, 男女生学习成 绩的关系,等等. 其关系 ...

  7. sklearn 相关性分析_人工智能和大数据的骨架支点—— 机器学习之相关性分析

    内容架构: 第一部分:简单线性回归 第二部分:如何用逻辑回归分类 第三部分:kaggle和泰坦尼克号预测 第一部分:简单线性回归 一.机器学习(Machine Learning, ML) 是机器学习算 ...

  8. 基于c#的相关性分析_基于数字高程模型的城市地貌与地名相关性分析——以兰州市为例...

    江西地名研究 基于数字高程模型的城市地貌与地名 相关性分析--以兰州市为例 文/张鹏丽,李育 提要:以兰州市为例,使用 ASTER 30米分辨率的数字高程模型DEM并提取了兰州市周边所有地名信息:通过 ...

  9. python 相关性分析_数据分析---用Python进行相关性分析(兼谈假设检验)

    一.相关关系和相关系数 世上除了因果关系,还有相关关系. 有一个叫"相关系数"的指标来量化两个事物之间的相关程度. 其中相关系数用"r"表示,取值范围介于-1和 ...

  10. 多元相关性分析_电子健康素养与中青年脑卒中患者健康行为的相关性分析

    电子健康素养与中青年脑卒中患者健康行为的相关性分析 戴春花 1, 王雪 1, 曾杏梅 1, 徐鹏翔 2, 冯基高 2 [ 摘要] 背景 近年来电子健康素养在慢性病患者的管理中受到广泛关注, 但目前关于 ...

最新文章

  1. Linq To select
  2. POJ - 2195 Going Home(二分图最小权匹配+KM+思维建边/最小费用最大流)
  3. Python 模块之 string.py
  4. 我的HTML总结之常用基础便签
  5. 线程下的udp和tcp局域网聊天
  6. 用sokit发送http请求和响应
  7. android文件读取文件内容,android创建txt文件,读取txt文件内容
  8. 如何用两个栈模拟实现一个队列
  9. 复杂知识图谱问答综述方法、挑战和解决办法
  10. 笔记本计算机内部部件,笔记本内部硬件构造有哪些
  11. linux的复制粘贴
  12. 数据可视化是什么,数据可视化怎么做最好?
  13. 万豪酒店集团5亿客户记录泄露
  14. Microsoft Office word 2019教程 - word中的excel表格随着excel表格的变化而变化
  15. 50个开机进BIOS按键查询
  16. wu版-天下无难试之Redis面试题刁难大全
  17. SODA理事会理事、苏打数据CEO高丰:只有数据流通,数据才能创造价值
  18. php http form的格式,multipart/form-data 格式的http请求,以及lua构造实现
  19. 计算机二级C语言100套题
  20. 百度ai 人脸识别 java_百度ai 接口 人脸识别

热门文章

  1. linux常用运行库,软件常用运行库-软件常用运行库scku下载 v3.1.0.0官方版--pc6下载站...
  2. 一个很好用的,免费的UML在线画图网站
  3. python linux 打印机,Python抓取打印机硒鼓和组件剩余量的爬虫
  4. SQL注入语法类型和sql盲注
  5. RS232和RS485标准在DB9公/母头上的接线定义
  6. Hypermesh-优化案例学习笔记-cclip
  7. PS插件:灯光工厂安装教程
  8. 读取excel数据,根据word模板生成word文件。【python】【word vba】两种方法
  9. 针式打印机设置字号大小
  10. c语言指针详解参数,C语言之指针详解