统计 | 统计功效 | R语言
在假设检验中,为了保证将真的判为假的概率很低,设置犯第一类错误的概率为α\alpha,通常情况下,α\alpha等于0.05或0.01。在现行的大学教科书中,根本没有提及将假的判为真的概率计算公式,下面来介绍如何计算统计功效,并介绍它的含义。
这里http://blog.csdn.net/xxzhangx/article/details/72811527 介绍了p值的计算,我们就接着它来完善统计功效的计算。
\mbox{统计功效} = 1 - \beta = 1- p( \mbox{接受} H_{0} | H_{0} \mbox{为假} ) = p( \mbox{拒绝} H_{0} | H_{0} \mbox{为假})
这里的β=p(接受H0|H0为假)\beta = p( \mbox{接受} H_{0} | H_{0} \mbox{为假} ) 为第二类错误。
对于两样本的假设检验:
原假设: H0=H1H_{0} = H_{1}
被择假设: H0−H1=δH_{0} - H_{1} = \delta
注:这里的δ\delta不等于0
统计功效反应了在H0H_{0}为假的前提下,落入拒绝域的概率。
计算公式如下:
\mbox{统计功效} = p( \mbox{拒绝} H_{0} | H_{0} \mbox{为假} ) = p( | \frac{\overline{x} - \overline{y}} {\sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} } } | > z_{1-\alpha/2} | \delta)
对上式子展开后为:
\mbox{统计功效} =1 - \Phi({z_{1-\alpha/2} - \frac{\delta}{\sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} }}} ) + \Phi(-z_{1-\alpha/2} - \sqrt{\frac{S_{x}^{2}}{n_{x}} + \frac{S_{y}^{2}}{m_{y}} })
代码如下:
> x <- 0.3
> y <- 0.5
> sx <- 3
> sy <- 5
> nx <- 10000
> ny <- 20000
> z <- (x-y)/(sqrt(sx^2/nx + sy^2/ny))
>
> power <- 1 - pnorm(qnorm(1-0.05/2) - z) + pnorm(-qnorm(1-0.05/2) - z)
> power
[1] 0.9906974
当然,若是改变了分布,其推导过程和上面雷同。
统计功效描述了原假设为假的条件下,我们还可以判别出原假设为假的概率。在控制犯第一类错误概率很低的条件下,如何避免犯第二类错误的概率β\beta也足够下呢?在学术界,统计功效的设定一般为0.8,将它作为计算的阈值。在p-value小于0.05且power大于0.8时认为是有显著差异的。
参考文献:
[1] http://cos.name/2016/03/asa-statement-on-p-value/#more-11902
[2] http://www.jianshu.com/p/b0f4c01c7602
若是有疑问,欢迎留言讨论,谢谢!
统计 | 统计功效 | R语言相关推荐
- 数据统计与分析基础实验三:常规数学统计计算(R语言,还没写完)
数据统计与分析基础实验三:常规数学统计计算 1.随机生成一个10x15的高斯矩阵,均值为自己学号后两位,方差为1.对该矩阵分别进行LU.QR.奇异值,并展示分解结果. LU QR 奇异值 2.利用软件 ...
- 统计建模与R软件(绪论)
统计建模与R语言系列博客以记录本人上课学习笔记和课后习题为主. 我们采用的教材如下所示: 以后的博客中,需要引用教材中的内容的,以 "教材Pxx页" 来说明. 欢迎大家提供建议或批 ...
- R语言与数据分析(2)-R语言简介
R语言的特点 1.有效的数据处理和保存机制 2.拥有一整套数组和矩阵的操作运算符 3.一系列连贯而又完整的数据分析中间工具 4.图形统计可以对数据直接进行分析和显示,可用于多种图形设备 5.一种相当完 ...
- 时间序列分析及应用r语言pdf_R语言:时间序列经典分析法(二)
题记:本文是个人的读书笔记,仅用于学习交流使用.本文将深入研究时间序列技术. 01 解决什么问题? 前面一章,介绍了时间序列中涉及到的基本概念,本章将在此基础上介绍如何对时间序列的资料进行分析,怎么选 ...
- r语言在java中的实现_R语言在现实中的应用
R语言在现实中的应用有哪些?主要有以下几种 - 1.数据科学 "哈佛商业评论"将数据科学家命名为"21世纪最性感的工作". Glassdoor将其命名为2016 ...
- rstudio python_如虎添翼:用Python与C++扩展R语言的应用场景
R语言是心理与统计学界中最受欢迎的编程语言之一.相比商业统计软件,R语言免费.开源.扩展性强:而相比其他开源编程语言,R的基本操作相对简单,统计与作图模块完善,适合进行统计分析工作. 然而,R语言并非 ...
- 快速学习R语言的经验分享
R语言的学习途径主要有几个:一个是R语言书籍:一个是R帮助文档:还有就是R视频和一些干货教程了. 越来越多的R学习者开始在网上分享自己的学习笔记,有的人会搭建自己的博客平台,有的人会使用现成的平台,其 ...
- 赠书!《R语言数据分析与可视化从入门到精通》
专注系列化.高质量的R语言教程 R语言是一个自由.免费.源代码开放的编程语言和环境,是S语言的一个分支,多个操作系统都能方便且免费地使用它.R语言不仅具有众多经常更新的统计分析函数,还具有完整的编程功 ...
- 毕业设计实用模型(四)——回归模型的实现(R语言)
目录 0引言 1.课本介绍 1.1理论的书 1.2 R语言的书 2.构造数据 3.相关性分析 4.多元回归模型的建立 4.1建立模型 5.2模型分析 5.3方差分析表 5.变量选择 5.1 逐步回归 ...
最新文章
- mysql并发更新数据,多用户并发修改数据解决方案。
- Java 内存 关系_内存一致性 – 发生在Java之前的关系
- Linux命令:less
- Python赋值、浅拷贝、深拷贝
- PAT甲级1012 The Best Rank :[C++题解]4个成绩取排名最低:排序、二分(好题)
- ndows live id怎么登陆,手机如何注册和使用Windows Live ID帐号
- php自定义中文分词方法,php实现的中文分词类完整实例
- 什么是 Round trip time RTT
- python response[200_python – django上的代码200 httpresponse
- javascript中es6语法
- 企业级Docker Registry开源工具Harbor的用户使用指南
- DPDK官方中文文档
- UTF-8 Unicode ANSI网页编码的区别
- 用html和css做动态动物,CSS3 SVG实现可爱的动物哈士奇和狐狸动画
- Android 编程神器,Android轻应用开发神器!
- 分布式事务系列一:BASE,一种ACID的替代方案(eBay分布式事务解决方案)
- Java快递驿站项目
- 二维数组主对角线与次对角线输出(C语言)
- 《转》openstack中删除虚拟主机,状态一直deleting
- 【计算机网络】计算机网络体系结构总结——基本知识要点汇总