此篇为假设检验相关,涵盖的并不全面,后续会慢慢的完善,如有纰漏欢迎指正~

目录

知识点参考来源

一、假设检验步骤

1.1 提出原假设与备择假设

1.2构建检验统计量

1.3根据事先给定的显著性水平α确定临界值拒绝域

1.4 根据临界值法决定是否拒绝原假设

二、补充知识点

2.1 第一类错误与第二类错误

2.1.1 第一类错误α

2.1.2 第二类错误β

2.1.3 α,β,样本量n的关系

2.2 p-值法

2.3 置信度与置信区间


知识点参考来源

1.《商务与经济统计》(原书第13版)
2.《校招面试考点全解析——数据分析师篇》
3.百度


一、假设检验步骤

假设检验是用统计数据判断命题真伪的方式。在统计学里,命题不能被证明是正确的,只能证明其否命题是错误的。

1.1 提出原假设与备择假设

在假设检验中,我们首先对总体参数做一个尝试性的假设,该假设被称为原假设,记作,然后,定义另一个与原假设内容完全相反的假设,称之为备择假设,记作,假设检验的过程就是根据样本数据来对这两个对立的假设进行检验的过程。一般来说,我们将想要推翻的假设作为原假设,而将想要检验证实的问题作为备择假设。

1.2构建检验统计量

在这一步,我们需要根据总体标准差是否已知选择构建的统计量。

  • 当总体标准差σ已知时对总体均值进行假设检验,选择标准正态随机变量z作为检验统计量,计算公式为:,其中为样本均值,为总体均值,n为样本量
  • 当总体标准差σ未知时,检验统计量的抽样分布是t分布。检验统计量服从自由度为n-1的t分布,公式为,其中s为样本标准差

1.3根据事先给定的显著性水平α确定临界值拒绝域

临界值是确定检验统计量的值是否小到足以拒绝原假设的一个基准, 即临界值是使得我们拒绝原假设的检验统计量的最大值。根据原假设的方式,有单侧拒绝域和双侧拒绝域。

双侧拒绝域:当原假设为=XX,这时候拒绝域在两侧,也叫做双侧检验。

单侧拒绝域:如果原假设有>XX,则拒绝域分布在左侧,称左侧检验;反之拒绝域分布在右侧,称右侧检验。

图中的 α即为事先给定的显著性水平,它代表了:当原假设为真时,检验统计量落在拒绝域,从而拒绝原假设的概率,也叫做第一类错误(弃真)。

在检验统计量的抽样分布中,检验统计量的临界值即为下侧面积α(显著性水平)相对应的值。

1.4 根据临界值法决定是否拒绝原假设

在双侧检验中,如果检验统计量或者,则拒绝原假设;

在左侧检验中,如果检验统计量,则拒绝原假设;

在右侧检验中,如果检验统计量,则拒绝原假设。


二、补充知识点

2.1 第一类错误与第二类错误

2.1.1 第一类错误α

即为进行假设检验中事先给定的显著性水平α,它代表了:当原假设为真时,检验统计量落在拒绝域,从而拒绝原假设的概率,也叫做弃真错误;

2.1.2 第二类错误β

代表了:当原假设为假时,检验统计量落在拒绝域以外,从而接受原假设的概率,也叫做存伪。

2.1.3 α,β,样本量n的关系

虽然在假设检验中通常没有控制第二类错误,但我们应知道,α,β,样本量n直接存在以下三种关系:

  • 当三者有二者已知时,即可计算得到第三者。公式为:
  • 对于给定的显著性水平α,增大样本容量将会减少β
  • 对于给定的样本容量,减小α将会使β增大,相反增大α将会使β减小

其中第三条是最为重要的,它说明不能毫无必要地选择太小的显著性水平α,对于给定的样本容量,选择较小的显著性水平意味着将使发生第二类错误的风险增大。

2.2 p-值法

p值和t值,z值一样,都是统计学中用于判断显著性的指标。它度量样本所提供的证据对原假设的支持程度,p-值越小说明拒绝原假设的证据越多。

可以将p值理解为原假设正确的概率,当p-值越小,就越不可能正确。

p-值法的拒绝法则:如果p-值α,则拒绝

2.3 置信度与置信区间

中心极限定理告诉我们,当抽样次数足够多时,样本的均值将围绕总体均值上下波动,而置信区间就是这个波动的范围,置信区间是在预先确定好的显著性水平下计算出来的,公式为:

,而置信度为1-α,综上可知置信区间与置信度是相互对应的。

数据分析统计知识—假设检验相关推荐

  1. 数据分析统计知识—描述性统计

    整理一下自己所掌握的数据分析中涉及的统计学知识点,参考的文章或链接会放在下面,此篇为描述性统计相关,涵盖的并不全面,后续会慢慢的完善,如有纰漏欢迎指正~ 目录 知识点参考来源 一.样本常见属性 1.1 ...

  2. #数据分析知识点--假设检验第一二类错误

    1.假设检验&第一第二类错误 假设检验是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立 假设检验的基本逻辑就是:我们为了解决一个疑问,就先做一个假设,然后在这个假设的基础上推 ...

  3. python模型预测_用Python如何进行预测型数据分析

    数据分析一般分为探索性数据分析.验证型数据分析和预测型数据分析.上一篇讲了如何用Python实现验证型数据分析(假设检验),文章链接:转变:用Python如何实现"假设检验"​zh ...

  4. 空间统计分析_CDA 数据分析师 Level 1 备考系列之推断性统计分析概述

    推断性统计相关概念与图表 随机试验.随机事件.随机变量 随机试验:a.可以在相同的条件下重复的进行:b.每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果:c.进行一次试验之前不能确定哪一个 ...

  5. 基于大数据的线上线下电商用户数据挖掘研究

    From:http://www.thebigdata.cn/JieJueFangAn/11932p2.html Online-to-Offline( 简称 O2O)电子商务模式,是一个连接线上用户和线 ...

  6. [阅读记录]《数据分析师求职面试指南》-2

    又是写在前面的一些碎碎念,大家都去读这本书!!(●'◡'●) 目录 第三章 基础知识考察 统计及数据分析知识 假设检验 贝叶斯统计概览 模型及数据挖掘知识 第四章 编程技能考察 熟悉Python pa ...

  7. Minitab软件是现代质量管理统计的领先者,全球六西格玛实施的共同语言,以无可比拟的强大功能和简易的可视化操作深受广大质量学者和统计专家的青睐。...

    Minitab软件是现代质量管理统计的领先者,全球六西格玛实施的共同语言,以无可比拟的强大功能和简易的可视化操作深受广大质量学者和统计专家的青睐. MINITAB 功能菜单包括: 基础和高级统计工具: ...

  8. 数据分析必备的统计学(二):假设检验

    此文是<10周入门数据分析>系列第10篇 想了解学习路线,可以先阅读" 学习计划 | 10周入门数据分析 " 讲完概率分布,再来讲讲统计学的最后一个知识点--假设检验. ...

  9. (补基础)数据分析系列:假设检验的基础知识

    JunLiang 数据科学家联盟 目录: 0x00 前言 0x01 基本思想 0x02 检验方向 拒绝域(拒绝域是由显著性水平围成的区域) 1.双尾检验 2.单尾检验 0x03 一类错误和二类错误 0 ...

  10. 数据分析——假设检验分析方法

    文章目录 前言 一.假设检验分析方法是什么,作用是什么? 二.步骤 1.提出假设 2.收集证据 3.得出结论 总结 前言 哈喽,大家好呀,我是小白~~ 今天学习了数据分析方法中的假设检验分析方法,以下 ...

最新文章

  1. WebStorm For Mac下载及破解方法
  2. vp翻N_VP刀叨叨:如何让G胖给你唱生日歌
  3. pyqt5 qscrollarea到达_pyqt5 QScrollArea设置在自定义侧(任何位置)
  4. Android之AsyncTask学习笔记
  5. 计算机 教育 初中 论文范文1000字,初中作文1000字
  6. 系统状态检测 及进程控制
  7. 用计算机编码原理解释,编码原理
  8. 解决SpringBoot集成Redis出现RedisConnectionException: Unable to connect to 192.168.64.100:6379
  9. 色彩转换系列之RGB格式与YUV格式互转原理及实现
  10. [Python人工智能] 四.神经网络和深度学习入门知识
  11. html 手指状态,HTML5技术教程 手指按下和手指抬起触发事件
  12. 视频教程-德国Vue.js2终极开发教程(含Vue路由和Vuex)-Vue
  13. 怎么定位html的坐标,css怎么定位图片的位置?
  14. ELK浅入浅出之环境搭建
  15. PreferenceActivity与PreferenceFragment理解
  16. 【原创】【学习笔记5】关于console相关修改
  17. 手把手教你写一个安卓app
  18. Auto.js 一个同一张图片多次多点找色的例子ColorMapping.findMultiColors
  19. 【DFS】马蹄印(Horseshoes)
  20. 集成电路设计专业有计算机课程吗,集成电路设计与集成系统专业开设课程设置,课程内容学什么...

热门文章

  1. Python求正态分布曲线下面积
  2. java实现表白动图
  3. 【sketchup 2021】草图大师的编辑工具2【路径跟随、偏移与轴、卷尺工具和尺寸、绘制参考线】
  4. 线元法输入曲线要素_交点法、线元法
  5. C# 根据身份证号码判断出生日期和性别
  6. 超级计算机每秒几兆次,这台超级计算机能在1秒内计算出你需要60亿年的时间
  7. 2019年数学建模美赛经验总结
  8. html5版微博qq登录,QQ和新浪微博登陆第三方的简单实现
  9. Github访问和下载慢的解决与提升方案
  10. Java递归求费数列和_简述java递归与非递归算法,0-100求和,斐波那契数列,八皇后,汉诺塔问题...