统计分析--对应分析
统计分析–对应分析
--------仅用于个人学习知识整理和sas/R语言/python代码整理
1.前言
对应分析,主要适用于有多个类别的分类变量,可以揭示同一个变量各个类别之间的差异,以及不同变量各个类别之间的对应关系(简介摘录自:https://www.jianshu.com/p/77a0d15f0336)
以下通过实际例子 使用sas及r语言 进行实现,以及附上对应分析图的解读方式(没有找到python的实现方式,如果有,请不吝赐教!)
2.sas实现
1.源数据准备
以下数据全为测试虚构数据,只用来说明数据格式及辅助图的解读
输入数据集为以下交叉表格式,每一个数据代表该组别该变量的人数,假设这里要看五组人群和变量之间的关系,得到交叉表如下:
2.sas对应分析
sas对应分析主要使用proc corresp过程步,在进行对应分析是var参数需要输入所有变量名,所以先将所有变量放入宏变量中,实现代码如下:
/*存放变量*/
proc contents data=rawdata out=cont noprint;run;
proc sql noprint;
select kcompress("'"||name||"'")||"n " into : name3 separated by ' ' from cont where name^='CLUSTER' and
name^='cluster' and name^='class' and name^='right';
quit;/*打印宏变量*/
%put &name3.;/*进行对应分析*/
proc corresp data=rawdata print=percent observed cellchi2 rp cpshort outc=data_out plot(flip);var &name3;id class;run;
%plotit(data=duiying.data_out,datatype=corresp,plotvars=Dim1 Dim2,color=black,href=0,vref=0)
/*绘制对应分析图; %plotit中指定的参数分别是输入数据集名称、数据类型、绘图的变量名,坐标轴的颜色和参考线。用前面的输出数据集results中两个变量Dim1 Dim2绘图*/
run;
3.对应分析图解读
首先可以看到,第一维度解释了65.41%,第二维度解释了24.92%,说明在两个维度上,能够说明数据的90.33%
对应分析图有很多种解读的方法,附上一篇很详细的对应分析图详解:
http://www.botaijixie.cn/shiti/10937.html
我们一般会使用向量分析,即看和这个人群比较关联的产品是哪些,在下图中,如果要看和a人群比较关联的label,会从原点出发,向a的方向画一个向量(原点到a的方向作为向量正向),然后每个产品点向这条直线做垂线,垂足和a点的正向越近,表示和a越关联
3.r语言实现
r语言主要使用ca包中的ca函数
附上一篇写的较为详细的r链接:https://www.douban.com/note/236880884/
ca_data <- read_excel("Z:/ca.xlsx")ca_data2<-as.data.frame(ca_data[,-1])
row.names(ca_data2)<-ca_data$classlibrary(ca)
plot(ca(ca_data2),dim = c(1,2),xlim=c(-1,1),ylim=c(-1,1), pch = c(16, 1, 17, 24))
统计分析--对应分析相关推荐
- 【多元统计分析】Python实现对应分析
(一)题目要求 数据集包含地区生产总值的四个相关指标:x1劳动者报酬,x2生产税净额,x3固定资产折旧,x4营业盈余.对各个地区生产总值进行对应分析,揭示不同地区的生产总值构成特征.要求:画出对应分析 ...
- 《多元统计分析与R语言》实验5【对应分析】
<多元统计分析与R语言>实验5[对应分析] 第一部分 教材P291页表格10-4,将由1660个人组成的样本按心里健康状况和社会经济状况进行交叉分组,分组结果如表所示,对这组数据进行对应分 ...
- 对应分析技术-一种强有力的统计分析方法
http://klarkew.blog.163.com/blog/static/23035757201210824211474/
- R语言实战应用-基于R语言的对应分析
一.基本概念和原理 对应分析(Correspondence Analysis)是在因子分析的基础上发展起来的,对应分析是多变量统计分析中有用的分析方法.对应分析把R型和Q型因子统一起来,通过R型因子分 ...
- spss分析方法-对应分析(转载)
spss分析方法-对应分析(转载) 对应分析也称关联分析.R-Q型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系.对应分析法是在R型和Q型因子分析的基础上发展起来的一种多元统计分析方法 ...
- python进行对应分析_对应分析
日常分析中, 经常会做的是研究变量间的关系, 对于分类变量, 常用的方法是卡 方检验. Logistic 模型等,但是对于分类变量很多,或者分类变量的类别很多 时,用上述方法除了就会非常复杂,并且结果 ...
- 多元统计分析及R语言建模(王斌会)第八、九、十章答案
1)试述主成分分析的基本思想 主成分分析是利用降维的思想,将多个变量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性组合,各主成分之间互不相关,从而这些主成分能够反映始变量的绝大部 ...
- python 多元线性回归_多元统计分析之多元线性回归的R语言实现
多元统计分析之多元线性回归的R语言实现 多元统计分析--multivariate statistical analysis 研究客观事物中多个变量之间相互依赖的统计规律性.或从数学上说, 如果个体的观 ...
- R语言JAVA对比_R语言统计分析应用与SAS、SPSS的比较
能够用来做统计分析的软件和程序很多,目前应用比较广泛的包括:SPSS, SAS.R语言,Matlab,S-PLUS,S-Miner等.下面我们来看一下各应用的特点: SPSS: 最简单的,都是菜单操作 ...
最新文章
- filezilla 共享多个目录_FileZilla|一个免费开源的FTP软件!
- 撸了个低代码开发平台,爽!
- 主宰全球的10大算法
- 《javascript设计模式》笔记之第十章 和 第十一章:门面模式和适配器模式
- 【Java_多线程并发编程】基础篇—线程状态及实现多线程的两种方式
- 一出好戏不止是部电影,它也正接近你的生活。
- pandas python csv_python:pandas合并csv文件的方法(图书数据集成)
- 【风控系统】风控中心—京东基于Spark的风控系统架构实践和技术细节
- express细节点注意
- 论SqlServer中char、varchar、nvarcahr和MySQL中char、varcahr的区别
- 安卓手机浏览器排行_安卓手机双11性价比排行发布|拯救者手机发透明版|小米发大光圈手机镜头...
- sql年月日24小时制_Power Query 抓取气象台24小时降水量数据
- 配置 HTTP 与 DNS 功能
- LabView学习笔记(六):while循环与for循环
- linux shell 脚本中变量截取
- 3D视觉(一)三维数学基础教程和SLAM
- Python垃圾回收机制:gc模块
- [python]关于numpy中sum函数的axis属性的理解
- codeforces 1293 A. ConneR and the A.R.C. Markland-N(思维)
- word里面的表格调整行高技巧