Statistics 基础之Hypothesis Tests1---t检验
介绍
假设检验是统计学中非常重要的一块内容,在现实生活中也有非常多的实际应用,比如A/B test时需要去评估实验组和对照组之间的差异是否显著。在这篇文章中,我会介绍常见的假设检验方法以及它们的应用场景,OK,我们开始。
t分布
在介绍t-检验前,我们先来简单介绍一下t分布。t分布主要用于描述样本统计量的分布,比如最典型的样本均值的分布。其分布总体呈现对称的形状,同时也受到sample size(或者说自由度)的影响,sample size越大,t分布越偏向于正态分布。当sample size趋向于无穷大时,t分布也趋近于正态分布。
根据中心极限定理,无论总体呈怎样的分布,样本统计量的分布均会趋于正态分布。比如当总体是正态分布时,样本均值的分布会趋向于N(mu,sigma^2/n)
,其中mu
代表总体的期望,sigma^2
代表总体的方差,n代表样本容量。假设某个样本均值为X_bar
,我们对其标准化后,可以构建z-statisitc, 即(X_bar-mu)/(sigma/sqrt(n))
,其符合标准正态分布。但是在一般情况下,总体的标准差sigma
是未知的,我们往往用样本的方差s
来代替它,从而得到我们的t-statistic的表达式(X_bar-mu)/(s/sqrt(n))
,该统计量符合t分布。
t检验
上面我们说了t分布,在这一部分,我们来说一下如何基于t分布来进行t检验。
1.单样本的均值检验,
含义:即检验单样本的均值是否和已知总体的均值相等。
前提:a.总体方差未知,否则我们可以直接使用Z检验。
b.样本数据正态分布或近似正态分布
检验目标:H0:样本均值与总体均值相等
H1:样本均值与总体均值不等 (双侧)
记总体的均值为mu
,方差为sigma^2
,如果样本Xi=1,2,3…,n服从整体的分布,我们有
借助卡方分布的重要结论
我们对(1)式和(2)式做如下操作,其实就是t统计量的计算公式,即一个t变量就是一个标准正态分布除以卡方分布变量除以自由度再开根号的结果。
可以得到
根据我们的样本均值X_bar
,样本容量n
以及样本标准差s
,我们计算t-statistic的值,然后根据我们事先给定的显著性水平,比如0.05,自由度n-1以及问题是单侧还是双侧检验,查表找到对应的临界值,通过比较对应问题的t-statistic的值和临界值,得到对应的结论。
2.双独立样本的均值检验
含义:检验两独立样本的均值是否相等。
前提:两样本独立,服从正态分布或近似正态分布。
情况一:总体方差相等且未知。
记总体方差为sigma=sigma1=sigma2
为了检验两组样本背后的总体均值相等(null hypothesis),我们计算样本均值差的分布。
同样的,根据卡方变量的结论
因为两分布独立,根据卡方的可加性,我们有
同样的,我们利用标准正态分布和卡方分布,构造对应的t-statistic
其中的sp为两样本的合并标准差,其表达式如下
计算对应的t-statistic的值,并根据给定的显著性水平和相应的自由度查表得到对应的临界值,与t-statistic做比较得到最终的结论。
情况二:总体方差不等且未知。
我们使用如下的统计量
其自由度为
其中v1=n1-1,v2=n2-1分别是X1,X2的自由度。
除此之外,常见的还有配对样本均值检验以及回归系数的显著性检验都应用t检验,限于本文的篇幅,不再继续探讨,感兴趣的朋友可以看一下这篇文章。
Statistics 基础之Hypothesis Tests1---t检验相关推荐
- 基础测绘1:10000成果检验需注意的问题
http://www.hljchzj.com/nv.asp?id=179 基础测绘1:10000成果检验需注意的问题 2011-5-11 15:08:05 作者:admin 罗 鹏 (黑龙江省测绘产 ...
- ks检验正态分布结果_数据分析基础(2)——正态分布检验
#寻找真知派#如上一篇文章所述,样本所属总体服从正态分布是数据分析和数据挖掘等数据处理的重要前提.如果我们采集的样本并不能确认其总体是否服从正态分布,那么数据处理的结果就是不可靠的.因此,对样本数据进 ...
- 【mathematical statistics】4 hypothesis testing
假设检验的概念与步骤 统计推断:由样本到总体的推理 常用的统计推断有三种 抽样分布 参数估计 假设检验 正态均值的检验 两正态均值差的推断 成对数据的比较 正态方差的推断 比率的推断 广义似然比检验
- 假设检验/T检验/F检验/Z检验/卡方检验
****显著性水平: 一个概率值,原假设为真时,拒绝原假设的概率,表示为 alpha 常用取值为0.01, 0.05, 0.10 ****什么是P值? p值是当原假设为真时样本观察结果及更极端结果出现 ...
- R语言基础 | 方差分析(1):单因素方差分析
专注系列化.高质量的R语言教程 推文索引 | 联系小编 | 付费合集 方差分析(Analysis of Variance, ANOVA)于1918年由Ronald Fisher(也是F分布的提出者)提 ...
- groovy怎样从sql语句中截取表名_SQL常用的基础查询语句
数据分析过程中,我们经常可以看到提数的SQL语句,了解SQL常用的基础查询语句,是检验提数逻辑是否正确的途径之一,并且也能更方便使用SMART BI数据分析工具.今天就让小编带大家走进SQL基础查询的 ...
- 单位根检验、航空模型、季节模型
单独写这篇文章的用意是源于我在单位根平稳性检验上面花费了很多时间,在这个过程中,又不断对季节模型有了更为深刻的理解,所以我要单独将这些心得写出来.本篇文章需要结合<收入时间序列--之模型探索篇& ...
- Summary of Statistics for Interview
Table of Contents P_value explain p-value to non-tech people Power of a test / statistical power Sta ...
- ks检验与s-w 检验_R统计检验函数汇总
资料来源:<R 语言核心技术手册>和 R 文档 数据基本来自胡编乱造 和 R 文档 本文基本囊括了常用的统计检验在 R 中的实现函数和使用方法. 连续型数据 基于正态分布的检验 均值检验 ...
最新文章
- 技术图文:如何利用C#实现Huffman编码?
- 解决运行eclipse内存不足的问题
- Linux 系统的配置文件
- beyond compare 4 的30天试用期已过-解决方法
- [css]我要用css画幅画(四)
- 浙江工商大学计算机学院调剂录取,浙江工商大学2017年硕士研究生调剂拟录取名单公布(持续更新)...
- apicloud手机查看效果
- android 自定义actionbar,如何让android的actionbar浮动且透明
- 大圣魔方——美团点评酒旅BI报表工具平台开发实践
- 线程同步与异步套接字编程
- for循环如果先--_乐字节Java循环:循环控制和嵌套循环
- python做马尔科夫模型预测法_用Python实现马尔可夫链蒙特卡罗
- xcode11 新功能_Xcode 11功能
- emblog博客打开显示 数据库密码错误,请返回主页的解决办法!
- 创 Lockdir 文件夹加密 破解
- Arduino ESP8266 通过WiFi、串口与DMX灯光通讯
- Android自定义控件(高手级)--JOJO同款能力分析图,这份字节跳动历年校招Android面试真题解析
- htcm7刷linux,HTC One M7 怎么刷机?刷机图文教程 ?
- Unity的摄像机拉近拉远和旋转脚本实现
- java fuoco车架_为速度而生 JAVA Fuoco铝合金气动公路
热门文章
- Java 使用Socket 实现基于DTU的TCP服务器 + 数据解析 + 心跳检测
- 转载:微信Windows版-无效的wechatwin.dll文件errcode:126,点击“确定”下载最新版本
- Excel将数值转换为按指定数字格式表示的文本
- Go语言之路:一、万丈高楼平地起
- imageView图片放大缩小及旋转
- Glide图片旋转与放大缩小
- 没有基础适合学习java吗?
- C++ 点(.)操作符和箭头(-)操作符
- HZNUOJ 2977 宝可梦决战 种族并查集
- Hyper 虚拟机删掉,如何恢复