在假设检验中,为了保证将真的判为假的概率很低,设置犯第一类错误的概率为α\alpha,通常情况下,α\alpha等于0.05或0.01。在现行的大学教科书中,根本没有提及将假的判为真的概率计算公式,下面来介绍如何计算统计功效,并介绍它的含义。

这里http://blog.csdn.net/xxzhangx/article/details/72811527 介绍了p值的计算,我们就接着它来完善统计功效的计算。

统计功效=1−β=1−p(接受H0|H0为假)=p(拒绝H0|H0为假)

\mbox{统计功效} = 1 - \beta = 1- p( \mbox{接受} H_{0} | H_{0} \mbox{为假} ) = p( \mbox{拒绝} H_{0} | H_{0} \mbox{为假})

这里的β=p(接受H0|H0为假)\beta = p( \mbox{接受} H_{0} | H_{0} \mbox{为假} ) 为第二类错误。

对于两样本的假设检验:
原假设: H0=H1H_{0} = H_{1}
被择假设: H0−H1=δH_{0} - H_{1} = \delta

:这里的δ\delta不等于0

统计功效反应了在H0H_{0}为假的前提下,落入拒绝域的概率。

计算公式如下:

统计功效=p(拒绝H0|H0为假)=p(|x¯−y¯S2xnx+S2ymy−−−−−−−√|>z1−α/2|δ)

\mbox{统计功效} = p( \mbox{拒绝} H_{0} | H_{0} \mbox{为假} ) = p( | \frac{\overline{x} - \overline{y}} {\sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} } } | > z_{1-\alpha/2} | \delta)

对上式子展开后为:

统计功效=1−Φ(z1−α/2−δS2xnx+S2ymy−−−−−−−√)+Φ(−z1−α/2−S2xnx+S2ymy−−−−−−−−√)

\mbox{统计功效} =1 - \Phi({z_{1-\alpha/2} - \frac{\delta}{\sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} }}} ) + \Phi(-z_{1-\alpha/2} - \sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} })

代码如下:

> x <- 0.3
> y <- 0.5
> sx <- 3
> sy <- 5
> nx <- 10000
> ny <- 20000
> z <- (x-y)/(sqrt(sx^2/nx + sy^2/ny))
>
> power <- 1 - pnorm(qnorm(1-0.05/2) - z) + pnorm(-qnorm(1-0.05/2) - z)
> power
[1] 0.9906974

当然,若是改变了分布,其推导过程和上面雷同。

统计功效描述了原假设为假的条件下,我们还可以判别出原假设为假的概率。在控制犯第一类错误概率很低的条件下,如何避免犯第二类错误的概率β\beta也足够下呢?在学术界,统计功效的设定一般为0.8,将它作为计算的阈值。在p-value小于0.05且power大于0.8时认为是有显著差异的。

参考文献:
[1] http://cos.name/2016/03/asa-statement-on-p-value/#more-11902
[2] http://www.jianshu.com/p/b0f4c01c7602

若是有疑问,欢迎留言讨论,谢谢!

统计 | 统计功效 | R语言相关推荐

  1. 数据统计与分析基础实验三:常规数学统计计算(R语言,还没写完)

    数据统计与分析基础实验三:常规数学统计计算 1.随机生成一个10x15的高斯矩阵,均值为自己学号后两位,方差为1.对该矩阵分别进行LU.QR.奇异值,并展示分解结果. LU QR 奇异值 2.利用软件 ...

  2. 统计建模与R软件(绪论)

    统计建模与R语言系列博客以记录本人上课学习笔记和课后习题为主. 我们采用的教材如下所示: 以后的博客中,需要引用教材中的内容的,以 "教材Pxx页" 来说明. 欢迎大家提供建议或批 ...

  3. R语言与数据分析(2)-R语言简介

    R语言的特点 1.有效的数据处理和保存机制 2.拥有一整套数组和矩阵的操作运算符 3.一系列连贯而又完整的数据分析中间工具 4.图形统计可以对数据直接进行分析和显示,可用于多种图形设备 5.一种相当完 ...

  4. 时间序列分析及应用r语言pdf_R语言:时间序列经典分析法(二)

    题记:本文是个人的读书笔记,仅用于学习交流使用.本文将深入研究时间序列技术. 01 解决什么问题? 前面一章,介绍了时间序列中涉及到的基本概念,本章将在此基础上介绍如何对时间序列的资料进行分析,怎么选 ...

  5. r语言在java中的实现_R语言在现实中的应用

    R语言在现实中的应用有哪些?主要有以下几种 - 1.数据科学 "哈佛商业评论"将数据科学家命名为"21世纪最性感的工作". Glassdoor将其命名为2016 ...

  6. rstudio python_如虎添翼:用Python与C++扩展R语言的应用场景

    R语言是心理与统计学界中最受欢迎的编程语言之一.相比商业统计软件,R语言免费.开源.扩展性强:而相比其他开源编程语言,R的基本操作相对简单,统计与作图模块完善,适合进行统计分析工作. 然而,R语言并非 ...

  7. 快速学习R语言的经验分享

    R语言的学习途径主要有几个:一个是R语言书籍:一个是R帮助文档:还有就是R视频和一些干货教程了. 越来越多的R学习者开始在网上分享自己的学习笔记,有的人会搭建自己的博客平台,有的人会使用现成的平台,其 ...

  8. 赠书!《R语言数据分析与可视化从入门到精通》

    专注系列化.高质量的R语言教程 R语言是一个自由.免费.源代码开放的编程语言和环境,是S语言的一个分支,多个操作系统都能方便且免费地使用它.R语言不仅具有众多经常更新的统计分析函数,还具有完整的编程功 ...

  9. 毕业设计实用模型(四)——回归模型的实现(R语言)

    目录 0引言 1.课本介绍 1.1理论的书 1.2 R语言的书 2.构造数据 3.相关性分析 4.多元回归模型的建立 4.1建立模型 5.2模型分析 5.3方差分析表 5.变量选择 5.1 逐步回归 ...

最新文章

  1. mysql并发更新数据,多用户并发修改数据解决方案。
  2. Java 内存 关系_内存一致性 – 发生在Java之前的关系
  3. Linux命令:less
  4. Python赋值、浅拷贝、深拷贝
  5. PAT甲级1012 The Best Rank :[C++题解]4个成绩取排名最低:排序、二分(好题)
  6. ndows live id怎么登陆,手机如何注册和使用Windows Live ID帐号
  7. php自定义中文分词方法,php实现的中文分词类完整实例
  8. 什么是 Round trip time RTT
  9. python response[200_python – django上的代码200 httpresponse
  10. javascript中es6语法
  11. 企业级Docker Registry开源工具Harbor的用户使用指南
  12. DPDK官方中文文档
  13. UTF-8 Unicode ANSI网页编码的区别
  14. 用html和css做动态动物,CSS3 SVG实现可爱的动物哈士奇和狐狸动画
  15. Android 编程神器,Android轻应用开发神器!
  16. 分布式事务系列一:BASE,一种ACID的替代方案(eBay分布式事务解决方案)
  17. Java快递驿站项目
  18. 二维数组主对角线与次对角线输出(C语言)
  19. 《转》openstack中删除虚拟主机,状态一直deleting
  20. 【计算机网络】计算机网络体系结构总结——基本知识要点汇总

热门文章

  1. Python:类与结构体
  2. 深入浅出通信原理连载41-70(Python代码版)
  3. 【Axure视频教程】随机函数random
  4. linux 查看java安装目录
  5. 从后渗透分析应急响应的那些事儿(二)免杀初识篇
  6. 使用切图工具经常遇到的问题
  7. unity 基于FGUI编辑器导出的图集切图工具
  8. C++读取HDF5文件
  9. 仅凭脑电波就能猜出密码?这款耳机暴露了脑机接口的大问题
  10. 数据类型(一)基本的数据类型