基础情境

一个任务有两个选项,多个不同年龄被试对此做出决策,获得两个年龄段选择两个选项的频次:

年龄

3-4

5-6

选项A

22

10

选项B

45

66

通过卡方检验对此进行分析,对应效应量指标为phi(φ)系数。

对于两个2×2的随机变量(x和y):

phi系数的计算公式: φ = (AD-BC) / √(A+B)(C+D)(A+C)(B+D)

R语言语句

方法一:prop.test()

该函数仅适用于有两个选项的情况,即一个被试只能做出是 vs. 否(或A vs. B)的回答。

#数据录入,先纵后横
data_chi = matrix(c(22,45,10,66),nrow = 2)#统计检验
> prop.test(data_chi)2-sample test for equality of proportions with continuity correctiondata:  data_chi
X-squared = 6.8455, df = 1, p-value = 0.008886
alternative hypothesis: two.sided
95 percent confidence interval:0.07721308 0.48697611
sample estimates:prop 1    prop 2
0.6875000 0.4054054 

在统计检验过程中有一个校正的问题需要注意,对应参数correct,默认的分析报告了校正后的结果,若无需校正,定义correct = F。关闭校正后结果如下:

> prop.test(data_chi,correct = F)2-sample test for equality of proportions without continuity correctiondata:  data_chi
X-squared = 7.938, df = 1, p-value = 0.004841
alternative hypothesis: two.sided
95 percent confidence interval:0.09734259 0.46684660
sample estimates:prop 1    prop 2
0.6875000 0.4054054 

从p值可以发现,是否校正还是对显著性有一定的影响的。关于这个问题还是有一点争议,不过似乎更多的人倾向于使用校正后的结果。从网站讨论中找到了这样的建议(似乎主要对皮尔逊卡方):

So, Yates showed that the use of Pearson's chi-squared has the implication of p–values which underestimate the true p–values based on the binomial distribution, but that you already know. Actually, statisticians tend to disagree about whether to use it: some statisticians argue that expected frequency lower that five should imply the use of that correction, while others use ten as that value, while others make the case that Yates' Correction should be used in every chi-squared tests with contingency tables 2 X 2.

ps. 上述网址中还包含另一种直接进行卡方检验的语句:

prop.test(x=c(226,181), n=c(365,335))

也就是直接定义x=0时的频次和样本量n,也可以使用prop.test()函数报告卡方检验结果。

方法二:chisq.test()

该函数可以直接对原始数据进行处理,不用再转换为矩阵。

#读取另外一组数据,对于一个题目,不同性别的被试做出了A或B的选择。
> S1A <- read_sav("S1a_Data_Analysis.sav")#原始数据集内容较多,只关注其中的gender和Choice变量
> str(S1A$gender)Factor w/ 2 levels "0","1": 2 2 2 2 2 2 2 2 2 2 ...> str(S1A$Choice)Factor w/ 2 levels "0","1": 2 1 1 1 2 1 1 1 2 2 ...#卡方检验
> chisq.test(x = S1A$gender, y = S1A$Choice)Pearson's Chi-squared test with Yates' continuitycorrectiondata:  S1A$gender and S1A$Choice
X-squared = 0.013288, df = 1, p-value = 0.9082

chisq.test语句也可以直接操作转换为列联表的数据

#将gender和Choice的数据转换为列联表
> chi.table <- table(S1A$gender,S1A$Choice)
> chi.table0  10 17 171 16 19#卡方检验运算,和之前直接调用原始数据变量名的结果相同
> chisq.test(chi.table)Pearson's Chi-squared test with Yates' continuitycorrectiondata:  chi.table
X-squared = 0.013288, df = 1, p-value = 0.9082

参考网址

效应量计算:phi系数

phi系数计算需调用psych包

library(psych)#对应方法一输入后的数据
phi(data_chi)
[1] 0.24#对应方法二的原始数据#首先需要将所关注的变量转换为表格
> chi.table <- table(S1A$gender,S1A$Choice)
> chi.table0  10 17 171 16 19#调用表格计算效应量
phi(chi.table)#输出结果
[1] 0.04

可以通过digits定义phi系数的小数位数

phi(data_chi,digits = 4)
[1] 0.2356

参考网址链接

卡方检验的其他类型

其他关于卡方检验的内容可以查阅这个网址,包含不同类型卡方检验的选择、卡方检验多重比较等等诸多内容。

R语言-2*2卡方检验与效应量相关推荐

  1. R语言建立和可视化混合效应模型mixed effect model

    最近我们被客户要求撰写关于混合效应模型的研究报告,包括一些图形和统计输出. 我们已经学习了如何处理混合效应模型.本文的重点是如何建立和可视化 混合效应模型的结果. 相关视频:线性混合效应模型(LMM, ...

  2. R语言中固定与随机效应Meta分析 - 效率和置信区间覆盖

    Meta分析是综合现有证据的重要工具. 我们围绕Meta技术进行一些咨询,帮助客户解决独特的业务问题.它通常用于医学和临床环境中,以评估关于治疗或暴露对感兴趣结果的影响的现有证据.基本思想是将先前研究 ...

  3. R语言学习:卡方检验

    本文是个人学习笔记 卡方检验用来检验类别变量. 一.频数与频率 性别在不同组中的频数: > gender_f <- table(data_paper$gender, data_paper$ ...

  4. 【数据分析入门】R语言给定置信度水平及效应值的情况下计算所需样本量

    功效分析 功效分析,power analysis,可以帮助在给定置信度的情况下,判断检测到给定效应值时所需的样本量.反过来,它也可以在给定置信度水平情况下,计算在某样本量内能检测到给定效应值的概率. ...

  5. 基于R语言混合效应模型(mixed model)案例研究

    全文链接: http://tecdat.cn/?p=2596 在本文中,我们描述了灵活的竞争风险回归模型.回归模型被指定为转移概率,也就是竞争性风险设置中的累积发生率(点击文末"阅读原文&q ...

  6. R语言线性混合效应模型(固定效应随机效应)和交互可视化3案例

    最近我们被客户要求撰写关于线性混合效应模型的研究报告,包括一些图形和统计输出. 视频:线性混合效应模型(LMM,Linear Mixed Models)和R语言实现案例 线性混合效应模型(LMM,Li ...

  7. 数据分享|R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化...

    全文链接:http://tecdat.cn/?p=22262 在讨论分类时,我们经常分析二维数据(一个自变量,一个因变量)(点击文末"阅读原文"获取完整代码数据). 但在实际生活中 ...

  8. R语言用CPV模型的房地产信贷信用风险的度量和预测

    全文链接:http://tecdat.cn/?p=30401 本文基于 CPV 模型, 对房地产信贷风险进行了度量与预测.我们被客户要求撰写关于CPV模型的研究报告(点击文末"阅读原文&qu ...

  9. R语言入门第五集 实验四:数据分析

    R语言入门第五集 实验四:数据分析 一.资源 [R语言]R语言函数练习--东北大学大数据班R实训第四次作业 R语言:常用apply函数(apply,tapply,sapply,lapply)用法介绍 ...

最新文章

  1. C++ 引用类型简介
  2. pytorch android
  3. 使用Windows Live Writer写博客
  4. 思科网络技术学院CCNA教程
  5. JZOJ 5709. 【北大夏令营2018模拟5.13】数列
  6. mysql innodb log_教你如何理解mysql中的innoDB log
  7. 陶哲轩实分析习题8.5.1
  8. 重要性采样(Importance Sampling)简介和简单样例实现
  9. 163 Blog试用有感
  10. 干货分享:vue2.0做移动端开发用到的相关插件和经验总结
  11. php过滤多空格_php如何去除多余空格
  12. Juniper 210 密码清不掉_iPhone 11 每次下载应用都需要输入密码怎么办?
  13. 深度linux 1050ti,Archlinux安装NVIDIA1050Ti显卡驱动
  14. STM32l151 使用滴答计时器精准延时1us,1ms
  15. 计算机二级vb上机题,计算机二级考试VB上机模拟题及答案
  16. 李开复:我要找什么样的人一起创业?
  17. JAVA语言五猴分桃简单解法_五猴分桃问题详解
  18. 递归_青蛙跳台阶(进阶版)
  19. Julia 构建对角矩阵 diag matrix
  20. 超级终端之手机连接篇

热门文章

  1. [Vuforia] 详解·高通Vuforia识别追踪3D物体/模型,Unity开发
  2. 简单好用的免费内网穿透工具
  3. 一位Java老铁的经历分享
  4. Blender Cycles 辉光(Bloom)效果
  5. The Necklace
  6. IE和chrom兼容性分析(持续更新)
  7. 0基础用vagrant 快速构建larval开发环境 (我杨某人尽力描述了,都有从0介绍)
  8. 放纵,正在毁掉这一代年轻人
  9. 基本的规范和约束(一)
  10. 冷迁移oracle数据库,Oracle数据库迁移--冷迁移