统计分析–对应分析

--------仅用于个人学习知识整理和sas/R语言/python代码整理


1.前言

对应分析,主要适用于有多个类别的分类变量,可以揭示同一个变量各个类别之间的差异,以及不同变量各个类别之间的对应关系(简介摘录自:https://www.jianshu.com/p/77a0d15f0336)

以下通过实际例子 使用sas及r语言 进行实现,以及附上对应分析图的解读方式(没有找到python的实现方式,如果有,请不吝赐教!)

2.sas实现

1.源数据准备

以下数据全为测试虚构数据,只用来说明数据格式及辅助图的解读
输入数据集为以下交叉表格式,每一个数据代表该组别该变量的人数,假设这里要看五组人群和变量之间的关系,得到交叉表如下:

2.sas对应分析

sas对应分析主要使用proc corresp过程步,在进行对应分析是var参数需要输入所有变量名,所以先将所有变量放入宏变量中,实现代码如下:

/*存放变量*/
proc contents data=rawdata out=cont noprint;run;
proc sql  noprint;
select kcompress("'"||name||"'")||"n " into : name3 separated by ' ' from cont where name^='CLUSTER' and
name^='cluster'  and name^='class' and  name^='right';
quit;/*打印宏变量*/
%put &name3.;/*进行对应分析*/
proc corresp data=rawdata print=percent observed cellchi2 rp cpshort outc=data_out plot(flip);var &name3;id class;run;
%plotit(data=duiying.data_out,datatype=corresp,plotvars=Dim1 Dim2,color=black,href=0,vref=0)
/*绘制对应分析图; %plotit中指定的参数分别是输入数据集名称、数据类型、绘图的变量名,坐标轴的颜色和参考线。用前面的输出数据集results中两个变量Dim1 Dim2绘图*/
run;
3.对应分析图解读

首先可以看到,第一维度解释了65.41%,第二维度解释了24.92%,说明在两个维度上,能够说明数据的90.33%

对应分析图有很多种解读的方法,附上一篇很详细的对应分析图详解:
http://www.botaijixie.cn/shiti/10937.html
我们一般会使用向量分析,即看和这个人群比较关联的产品是哪些,在下图中,如果要看和a人群比较关联的label,会从原点出发,向a的方向画一个向量(原点到a的方向作为向量正向),然后每个产品点向这条直线做垂线,垂足和a点的正向越近,表示和a越关联

3.r语言实现

r语言主要使用ca包中的ca函数
附上一篇写的较为详细的r链接:https://www.douban.com/note/236880884/

ca_data <- read_excel("Z:/ca.xlsx")ca_data2<-as.data.frame(ca_data[,-1])
row.names(ca_data2)<-ca_data$classlibrary(ca)
plot(ca(ca_data2),dim = c(1,2),xlim=c(-1,1),ylim=c(-1,1), pch = c(16, 1, 17, 24))

统计分析--对应分析相关推荐

  1. 【多元统计分析】Python实现对应分析

    (一)题目要求 数据集包含地区生产总值的四个相关指标:x1劳动者报酬,x2生产税净额,x3固定资产折旧,x4营业盈余.对各个地区生产总值进行对应分析,揭示不同地区的生产总值构成特征.要求:画出对应分析 ...

  2. 《多元统计分析与R语言》实验5【对应分析】

    <多元统计分析与R语言>实验5[对应分析] 第一部分 教材P291页表格10-4,将由1660个人组成的样本按心里健康状况和社会经济状况进行交叉分组,分组结果如表所示,对这组数据进行对应分 ...

  3. 对应分析技术-一种强有力的统计分析方法

    http://klarkew.blog.163.com/blog/static/23035757201210824211474/

  4. R语言实战应用-基于R语言的对应分析

    一.基本概念和原理 对应分析(Correspondence Analysis)是在因子分析的基础上发展起来的,对应分析是多变量统计分析中有用的分析方法.对应分析把R型和Q型因子统一起来,通过R型因子分 ...

  5. spss分析方法-对应分析(转载)

    spss分析方法-对应分析(转载) 对应分析也称关联分析.R-Q型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系.对应分析法是在R型和Q型因子分析的基础上发展起来的一种多元统计分析方法 ...

  6. python进行对应分析_对应分析

    日常分析中, 经常会做的是研究变量间的关系, 对于分类变量, 常用的方法是卡 方检验. Logistic 模型等,但是对于分类变量很多,或者分类变量的类别很多 时,用上述方法除了就会非常复杂,并且结果 ...

  7. 多元统计分析及R语言建模(王斌会)第八、九、十章答案

    1)试述主成分分析的基本思想 主成分分析是利用降维的思想,将多个变量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性组合,各主成分之间互不相关,从而这些主成分能够反映始变量的绝大部 ...

  8. python 多元线性回归_多元统计分析之多元线性回归的R语言实现

    多元统计分析之多元线性回归的R语言实现 多元统计分析--multivariate statistical analysis 研究客观事物中多个变量之间相互依赖的统计规律性.或从数学上说, 如果个体的观 ...

  9. R语言JAVA对比_R语言统计分析应用与SAS、SPSS的比较

    能够用来做统计分析的软件和程序很多,目前应用比较广泛的包括:SPSS, SAS.R语言,Matlab,S-PLUS,S-Miner等.下面我们来看一下各应用的特点: SPSS: 最简单的,都是菜单操作 ...

最新文章

  1. filezilla 共享多个目录_FileZilla|一个免费开源的FTP软件!
  2. 撸了个低代码开发平台,爽!
  3. 主宰全球的10大算法
  4. 《javascript设计模式》笔记之第十章 和 第十一章:门面模式和适配器模式
  5. 【Java_多线程并发编程】基础篇—线程状态及实现多线程的两种方式
  6. 一出好戏不止是部电影,它也正接近你的生活。
  7. pandas python csv_python:pandas合并csv文件的方法(图书数据集成)
  8. 【风控系统】风控中心—京东基于Spark的风控系统架构实践和技术细节
  9. express细节点注意
  10. 论SqlServer中char、varchar、nvarcahr和MySQL中char、varcahr的区别
  11. 安卓手机浏览器排行_安卓手机双11性价比排行发布|拯救者手机发透明版|小米发大光圈手机镜头...
  12. sql年月日24小时制_Power Query 抓取气象台24小时降水量数据
  13. 配置 HTTP 与 DNS 功能
  14. LabView学习笔记(六):while循环与for循环
  15. linux shell 脚本中变量截取
  16. 3D视觉(一)三维数学基础教程和SLAM
  17. Python垃圾回收机制:gc模块
  18. [python]关于numpy中sum函数的axis属性的理解
  19. codeforces 1293 A. ConneR and the A.R.C. Markland-N(思维)
  20. word里面的表格调整行高技巧

热门文章

  1. JavaWeb《后端内容:5. 项目实战:书城系统(下篇)》
  2. java string 转boolean_Java String转boolean
  3. 去除PPT幻灯片编辑密码
  4. 区块链技术在格鲁吉亚的潜力
  5. 【手拉手 带你准备电赛】PWM究竟是什么(附:PWM输出实验完整代码)
  6. Vue中filter函数 过滤器的使用
  7. Linux系统操作(4):Linux Ubuntu 屏幕清理命令
  8. 第十四周 程序阅读,理解虚函数与纯虚函数
  9. VR消防虚拟实训系统,带你身临其境学习消防逃生技能
  10. Metasploit 生成各种后门