在数据分析过程中,往往需要数据服从正态分布,正态分布,也称“常态分布”,又名高斯分布,在求二项分布的渐近公式中得到。很多方法都需要数据满足正态分布,比如方差分析、独立t检验、线性回归分析(因变量)等。如果说没有这个前提可能会导致分析不严谨等等。所以进行数据正态性检验很重要。那么如何进行正态性检验?接下来进行说明。

一、检验方法

SPSSAU共提供三种正态性检验的方法,分别是描述法、正态性检验以及图示法,其中图示法包括直方图以及P-P/Q-Q图。

1.描述法

理论上讲,标准正态分布偏度和峰度均为0,但现实中数据无法满足标准正态分布,因而如果峰度绝对值小于10并且偏度绝对值小于3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。从上表可以看出例子中峰度为1.160绝对值小于10,偏度为-1.084绝对值小于3。说明数据基本可以接受为正态分布。

2.正态性检验

SPSSAU的正态性检验包括三种:正态性shapro-WiIk检验、正态性Kolmogorov-Smirnov检验和Jarque-Bera检验。

背景简单描述:调查一个班级的53名学生的身高,判断搜集的数据是否满足μ=140.79,σ=8.6的正态分布。

由于n>50,所以检验方法选择K-S检验或者J-B检验。如果利用K-S检验进行证明,步骤如下:

  1. H0:x服从μ=140.79,σ=8.6的正态分布
    H1:x不服从μ=140.79,σ=8.6的正态分布
    附表如下:

(图片来源于:网络侵删)

因为样本超过35,并且α=0.05,所以D53,0.05约为1.36/≈0.187;

  1. 相应指标

首先计算K-S检验中的D统计量,计算公式如下:

D=max{D+,D−}

D+=|Fn(x(k))−F0(x(k))|

D−=|Fn(x(k))−F0(x(k−1))|

首先将数据按从小到大进行排序,用x(k)进行描述,k代表次序,然后计算其标准化的数据,标准化公式为:

x′=x−μσ ;接着算出每个数据的频次,并记录好累积频次,然后计算 Fn(x(k)) ,(N为累积频次),n为样本量即例子中的53。 F0(x(k)) 为给定的累计分布可以利用excel自行算出,函数为:‘=NORM.DIST(x,mean,sd,TRUE) mean和sd就为 μ 和 σ 。进而可以求出和;各个步骤的计算如下:

所以可以算出D为0.218,D大于0.187,所以拒绝原假设,接受备择假设所以不满足。

同时可以使用SPSSAU进行检验更为方便,数据格式如下:

将数据上传到SPSSAU进行分析,操作如下:

分析结果如下:

从上述结果得到,样本量大于50,所以选择K-S检验,发现统计量D为0.218(和计算的一样),p值小于0.05,所以模型显著,拒绝原假设,数据不服从正态分布。

同时SPSSAU还提供了JB检验:

Jarque-Bera检验中,p值小于0.05,所以模型显著,拒绝原假设,数据不服从正态分布(针对SPSSAU提供统计量为卡方值的原因:有证明显示在正态性假定下,JB统计量渐近地服从自由度为2的卡方分布)

3.图示法

(1)直方图

直方图若呈现‘中间高,两边低,左右基本对称的钟形图’则基本服从正态分析,但是数据量过少等也可能影响结果导致很难呈现出标准的正态分布,如果是这种情况如果看见‘钟形’也可以可以接受的。上图可以看出,数据呈现的分布并不对称,但是也出现近似‘钟形’曲线,所以也可以勉强接受。

(2)P-P图

P-P图是将观察累积概率作为X轴,将正态累积概率作为Y轴,作散点图,反映实际累积概率与理论累积概率的符合程度。如果散点分布近似‘对角线’则可以认为正态分布,从图中可以看出数据散点分布不是很满足要求,但是也近似为‘对角线’所以勉强接受。

(3)Q-Q图

Q-Q图和P-P图功能一致,分析上大致没有区别。

二、如何进行正态性检验

SPSSAU分析位置

(1)通用方法板块

SPSSAU【通用方法】→描述/ SPSSAU【通用方法】→正态性检验;

(2)可视化板块

SPSSAU【可视化】→直方图/ SPSSAU【可视化】→p-p/q-q图;

三、非正态数据怎么办

针对上述几种方法,正态性检验最为严谨,但是实际数据由于样本量较少等原因,即使数据总体正态但统计检验出来也显示非正态,实用性没有图示法直观且接受性没有图示法高,所以在分析中常常图示法应用的比较多,如果在分析中数据严重不正态应该怎么办呢?接下来进行说明。

(1)将数据取对数处理

注意:原数据需要数据大于0,如果不满足也可以取lg(x+k)等。

(2)开根号

(3)取倒数

当数据波动较大时可以优先考虑.

(4)Johnson转换

(4) 计量经济学中常用的BOX-COX变换

(5)移除可能异常值

通常情况下,数据经过处理会变得相对“正态”一些;此步可使用SPSSAU的“生成变量”功能即可完成。

或者严重不符合正态分布无法进行分析也可以使用其他分析方法,比如非参数检验等。


更多干货请登录SPSSAU官网进行查看。

写论文时,不知道如何检验正态分布?相关推荐

  1. 写论文时要用到的word技巧

    1 WORD里边怎样设置每页不同的页眉?如何使不同的章节显示的页眉不同? 答:分节,每节可以设置不同的页眉.文件--页面设置--版式--页眉和页脚--首页不同 2 请问word中怎样让每一章用不同的页 ...

  2. 写论文时遇到的问题及解决办法

       问题1:利用endnote关于出现{ },而不是[1]. 解决办法:找到WORD中的update Citations and Bibliography,点击后,即可恢复[].    问题2:写论 ...

  3. 写论文时,Word文档修改保存后,文件越来越大的解决方法

    写论文时,Word文档经过反复修改保存后,文件会越来越大,十分烦人,网上找了很多解决办法,按个尝试,现在总结分享出来,让大家少走弯路. 缩小word文件大小第一招: Word在保存DOC文件时只是把一 ...

  4. html怎么设置页脚注释,Word写论文时怎么插入页脚注释?

    回答: 2003Word写论文时,页眉页脚页边距设置方法如下: 一.在同一篇论文中设置不同的页眉 ,操作方法: 1.把光标分别定位在需要设置新页眉的位置,然后执行"插入"菜单→&q ...

  5. word写论文时参考文献、目录以及页码设置

    word写论文时参考文献.目录以及页码设置 文章目录 word写论文时参考文献.目录以及页码设置 一:参考文献通过交叉引用设置超链接 二:页码设置:设置不同格式页码,在任意位置插入新页码以及生成目录 ...

  6. 写论文时如何翻译外文文献?

    搞科研就是集所有既有成果为大成者. 想要论文写得好,一定要有丰富的知识储备和对该领域专业技能的熟练掌握,这其中不可能少的了外文文献的知识储备. 外文文献的阅读十分重要.那么阅读的前提是什么呢?翻译! ...

  7. 为什么写论文时一定要引用论文?

    许多同学在写论文时,都会发出一个疑问,为什么要引用他人论文?把自己的内容写好了不就行了吗?引用他人论文,又要看大量论文,又要找几个结果不同的原因,甚至在参考文献格式上也都要下很大的功夫,这样费时费力的 ...

  8. 写论文时 复杂的三线表模板 三线表需要辅助线 辅助线需要断开 表格

    写论文时 三线表需要辅助线 辅助线需要断开 表格 论文 画表格时候 三线表需要辅助线 辅助线断开的方法 如下面这种表格 画笔白色 粗一些6磅边框 再用边框刷画

  9. word在写论文时参考文献设置技巧

    2019.11.27更新 个人推荐直接使用第三方软件进行参考文献插入,推荐NoteExpress,这个软件在安装好后会在word中加入插件 通过word中的插件可以直接进行插入引文,而且参考文献的序号 ...

  10. 写论文时如何快速的把文中的数字和英文替换文 Times New Roman

    在写论文时,我们通常需要快速的把文种的数字和字母替换为 Times New Roman字体,中文为宋体,但是如果一个个修改是比较麻烦的,当内容量过多时,查找替换也不是很方便,因此有个简单快速的技巧. ...

最新文章

  1. grub中mbr的程序
  2. Redis-20Spring缓存机制整合Redis
  3. HDU - 3065 病毒侵袭持续中(AC自动机)
  4. cdn转发防攻击_高防CDN和高防服务器的区别?
  5. 关于SEL的简单总结
  6. Oracle 隔离级别
  7. DAY 34 进程通信、消费者模型和线程
  8. 数据可视化的定义及使用注意
  9. 频率对电感值和电感尺寸的影响 // 《精通开关电源设计》P50:频率对电感值和电感尺寸的影响
  10. 【数据结构】图的存储结构—邻接矩阵
  11. 大华服务器装系统,clonezilla安装系统理论篇
  12. ::ffff:192.168.31.101 是一个什么地址?
  13. 从抖音到“奶头乐“,它是如何一步步毁掉我们的?
  14. 微信小程序 -- 真机调试时没问题,上线后无法访问服务器
  15. 手机普通浏览器唤起微信打开网页url
  16. ValueError: continuous format is not supported
  17. 变量命名神器Codelf
  18. scratch案例——神奇闹钟
  19. 马蜂窝站队腾讯,在线旅游的格局已定?
  20. 树莓派 --- 人脸口罩识别智能监控

热门文章

  1. live555 推RTSP音视频流总结(一) 交叉编译
  2. GitHub 教程资源目录
  3. 求助!校园认证网络如何进行自动登录 java
  4. C++vector类
  5. 电子白板的开源项目【whiteboard】
  6. 网页版在线流程图绘制工具Diagram
  7. 中国蔬菜摊行业市场供需与战略研究报告
  8. 上海交大计算机复试机试,交大机试面试第一帖之10版-以及复试准备
  9. java计算机毕业设计敬老福利院管理源码+mysql数据库+系统+lw文档+部署
  10. Between and 对比 大于等于 小于等于