****基于spss的正态分布正态性检验****

  • 正态分布
  • 正态性检验
    • 频率直方图
      • 实验步骤
    • P-P图
      • 实验步骤
    • Q-Q图
      • 实验步骤
    • K-S 检验
      • 实验步骤
    • 描述法(偏度和峰度系数检验)
      • 实验步骤

简要介绍这五种方法,
有需要数据练习的练习我

正态分布

 正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)。

正态曲线呈钟型,中间高,两头低,左右对称。因其曲线呈钟形,因此人们又经常称之为钟形曲线。而当我们得到一组数据需要判断其是否是符合正态分布时,常常通过偏度、峰度统计量去体现,分别表示了正态曲线的偏离中心程度,以及集中趋势。

当一组数据的分布形式形如上图的形式,则可以称其服从正态分布。而我们所需要做的就是检测数据的分布形式。

                             接下来以SPSS做为操作软件,进行讲解。

正态性检验

实验案例数据来源于《实用回归分析》P6,表1.2数据,使用软件为SPSS25。

频率直方图

在直角坐标系中,
横轴表示样本数据的连续可取数值,按数据的最小值和最大值把样本数据分为m组,使最大值和最小值落在开区间(a,b)内,a略小于样本数据的最小值,b略大于样本数据的最大值。组距为d=(b-a)/m,各数据组的边界范围按左闭右开区间,如[a,a+d),[a+d,a+2d),……[a+(m-1)d,b)。
纵轴表示频率除以组距的值,以频率和组距的商为高、组距为底的矩形在直角坐标系上来表示,由此画成的统计图叫做频率分布直方图。

实验步骤

  1. 分析(A)
  2. 描述统计(E)
  3. 频率(F)
  4. 选择需要检验的变量
  5. 图表一栏中如图勾选

P-P图

P-P图是根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图,用于直观地检测样本数据是否符合某一概率分布。如果样本数据服从所假定的正态分布,则散点较好地落在原点出发的 45°线附近。

实验步骤

  1. 分析(A)

  2. 描述统计(E)

  3. P-P图

  4. 选择需要检验的变量

  5. 检验分布选择正态分布

    实验结果:

     可以看出数据散点基本落在原点出发的45°线附近,所以样本数据服从所假定的正态分布。
    

Q-Q图

Q-Q图(Q代表分位数)是一个概率图,用图形的方式比较两个概率分布,把他们的两个分位数放在一起比较。首先 选好分位数间隔。图上的点(x,y)反映出其中一个第二个分布(y坐标)的分位数和与之对应的第一分布(x坐标)的 相同分位数。因此,这条线是一条以分位数间隔为参数的曲线。用概率分布的分位数进行正态性考察,如果样本数对应的总体分布确为正态分布,则在Q-Q 图中,样本数据对应的散点应基本落在原点出发的 45°线附近。

实验步骤

实验步骤与P-P图相似

  1. 分析(A)

  2. 描述统计(E)

  3. Q-Q图

  4. 选择需要检验的变量

  5. 检验分布选择正态分布

    实验结果:

     可以看出数据散点基本落在原点出发的45°线附近,所以样本数据服从正态分布。
    

K-S 检验

将需要做统计分析的数据和另一组标准数据进行对比,求得它和标准数据之间的偏差的方法。一般在K-S检验中,先计算需要做比较的两组观察数据的累积分布函数,然后求这两个累积分布函数的差的绝对值中的最大值D。最后通过查表以确定D值是否落在所要求对应的置信区间内。若D值落在了对应的置信区间内,说明被检测的数据满足要求。反之亦然。用K-S作正态性检验是通过对比数据序列与标准正态分布有没有显著性差异来判断序列是否满足正态分布。通过比较检测显著性水平 P 值,P>0.05,说明与正态性没有显著差异,成正态性分布。

实验步骤

  1. 分析(A)

  2. 非参数检验(N)

  3. 单样本(O)

  4. 选择需要检验的变量

    实验结果:

     K-S 检验的显著性 P=0.088>0.05,接受销售额的分布为正态分布的零假设,所以销售额基本成正态性分布。
    

描述法(偏度和峰度系数检验)

偏度(skewness)
是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。
正态分布的偏度为0,两侧尾部长度对称。若以bs表示偏度。bs<0称分布具有负偏离,也称左偏态;bs>0称分布具有正偏离,也称右偏态;而bs接近0则可认为分布是对称的。

峰度(Kurtosis)
与偏度类似,是描述总体中所有取值分布形态陡缓程度的统计量。
这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭;峰度小于0表示该总体数据分布与正态分布相比较为平坦, 峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。

描述法即通过描述数据偏度(K)和峰度(W)系数检验数据的正态性。理论上讲,标准正态分布偏度和峰度均为 0,但现实中数据无法满足标准正态分布,因而如果峰度绝对值小于 10 并且偏度绝对值小于 3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。

实验步骤

  1. 分析(A)

  2. 描述统计(E)

  3. 描述(D)

  4. 选择需要检验的变量

  5. 在选项窗口里如图勾选

    实验结果:

     可以看出销售额的峰度绝对值为 0.289<10,且偏度绝对值 0.872<3,所以基本可接受数据为正态分布。
    

基于spss的正态分布正态性检验相关推荐

  1. 基于SPSS的中国消费者信心指数影响因素分析-----相关性分析

    说明:本案例基于spss数据分析与挖掘实战案例精粹----第10章 案例背景:对受访者的背景资料对消费者信心指数的影响加以研究,并进一步考察其内部的详细作用方式: 分析方法:使用方差分析对自变量进行筛 ...

  2. 基于SPSS的美国老年夏季运动会运动员数据分析

             本文是课程训练的报告,部分图片由于格式原因并没有贴出,有兴趣者阅读完整报告者输入以下链接 http://files.cnblogs.com/files/liugl7/基于SPSS的老 ...

  3. 普通玩家版基于SPSS的PCA攻略

    这是一篇精准打击PCA之基于SPSS实战 我请我自己写一个普通玩家版基于SPSS平台的PCA攻略,以防我这个笨蛋白痴下次又重新学过.. PCA是什么? 主成分分析法(PCA), 是一种常用的无监督学习 ...

  4. 基于SPSS Moderler和R语言的数据挖掘宽表处理

    基于SPSS Moderler和R语言的数据挖掘宽表处理 -电信业客户流失分析 一.商业理解 1.问题的提出: 1)问题1:预测哪些客户(尤其是高价值客户)可能会流失? 2)问题2:可能流失客户的特征 ...

  5. 基于SPSS的主成分分析(PCA)

    主成分分析(Principal Component Analysis,PCA)是一种统计方法.PCA以降维方式,在损失很少信息的前提下通过正交变换将一组可能存在相关性的变量(多个指标)转换为一组线性不 ...

  6. 大学生使用计算机的调查,基于SPSS 对大学生电脑使用情况的调查研究

    基于SPSS 对大学生电脑使用情况的调查研究 发表时间:2013-7-10 9:07:39 JIANGSU UNIVERSITY OF TECHNOLOGY 专业见习报告 基于SPSS 对大学生电脑使 ...

  7. 基于spss的曲线回归(curvilinear regression)

    基于spss的曲线回归 一.简介 1.线性回归 2.曲线回归 3.非线性回归 4.分类 二.曲线回归 1.曲线直线化 2.曲线估计 3.基本曲线的类型和特点 (1)指数函数 (2)对数函数 (3)幂函 ...

  8. 基于spss的主成分分析法(Principal Component Analysis,PCA)

    主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法. 在实际课题中,为了全面分析问题,往往提出很多与此 ...

  9. 基于spss的分段回归模型(piecewise linear regression)

    基于spss的分段回归模型 一.简介 二.模型分析 三.基于spss的案例分析 (一)图像分析 (二)回归分析 参考文章: 一.简介  分段线性回归是指当y对x的回归在x的某一范围的服从某种线性关系, ...

  10. 大学计算机基础 试卷分析,基于SPSS大学计算机基础考试试卷分析.doc

    基于SPSS大学计算机基础考试试卷分析 基于SPSS大学计算机基础考试试卷分析 摘要:试卷分析包括成绩分析和试卷质量分析两部分.该文以西南林学院2007-2008级的消防工程专业的大学计算机基础考试为 ...

最新文章

  1. Linux进阶之路————开机、重启和用户登录注销
  2. 阿里开源自研语音识别模型 DFSMN,准确率高达96.04%
  3. jvm垃圾收集器与内存分配策略
  4. SQL Server报表——小白开发笔记
  5. 分治法-求最大最小元素
  6. hadoop put命令的格式_Hadoop Shell命令
  7. 使用nltk库查找英文同义词和反义词
  8. 华硕无畏15 2023款和华硕无畏15i 2023区别 对比评测选哪个好
  9. 2022-2028年全球及中国红外(IR)传感器行业投资前景分析
  10. hoolilaw案例分析:在美国如何治理扰民邻居
  11. 田忌赛马(贪心算法)C++
  12. 最新天迹云通信短信分销系统源码+已修复完美版
  13. org.apache.commons.codec.binary.Base64包需要下载的jar包依赖
  14. 水文实时在线监测系统
  15. Doxygen详细介绍
  16. 爬虫项目十四:Python爬下豆瓣《我的姐姐》两千条影评,看看大家对其评价如何
  17. 输入一个正整数,求该数的阶乘。询问用户是否愿意继续。(使用嵌套循环实现) 【提示】: 1.N 的阶乘公式为:n! = 1 × 2 × … × (n - 1) × n 2.
  18. 被报表需求逼疯的银行数据人,是时候放弃用Excel做报表了
  19. ViewPage禁止滑动原理解析
  20. 3D智能制造数字化车间建设解决方案

热门文章

  1. 嵌入式中的通讯协议——UART、I2C、SPI、DMA
  2. md5加密算法使用流程
  3. 80386常用内部寄存器
  4. 微信小程序button修改边框样式after
  5. python 合并word并生成目录_使用Python制作WORD报告
  6. Word文档转PDF后文件变小、图片不清晰解决办法
  7. 网络远程控制原理及技术实现
  8. openmodelica安装
  9. 手动安装K8s第五节:master节点kubectl命令部署
  10. 微信换头像小程序实现原理及源码