文章目录

  • 一、引述
  • 二、假设检验
  • 三、对皮尔逊系数进行假设检验
    • 1. 步骤
    • 2.更好用的方法:p值判断法
  • 三、皮尔逊相关系数检验的条件

一、引述

在上一篇文章中,我们已经介绍了如何求解Person相关系数。那么如何解释相关系数的大小呢?事实上,如果我们只是通过相关系数大小去判断两个变量之间的相关性,这种做法是不严谨的。因为对相关系数的解释依赖于具体的应用背景和目的的。因此,相比较于相关系数的大小,我们往往更关注于显著性。而求解显著性,则需要假设检验方法。

二、假设检验

请仔细阅览下一部分。

三、对皮尔逊系数进行假设检验

1. 步骤

  1. 提出原假设(零假设)H0和备择假设H1(两者假设是截然相反的)
    假设我们得到了一个皮尔逊相关系数r,我们想检验它是否显著的异于0,那么我们可以这样设定原假设和备择假设:H0:r = 0,H1:r ≠ 0。(通常来说,备择假设才是研究者最想知道的)(r ≠ 0,是一个双侧检验,因为其可以分为两个单侧检验:r > 0, r < 0

  2. 在原假设成立的条件下,利用我们要检验的量构造出一个符合某一分布的统计量。(统计量相当于我们要检验的量的一个函数,里面不能有其他的随机变量)(分布一般有四种:标准正态分布、t 分布、卡方分布、F分布)
    对于皮尔逊相关系数r而言,在满足一定条件下,我们可以构造统计量(式子中n为已知的样本量):

    可以证明,t是服从自由度为n-2t分布。

  3. 将我们要检验的r值代入该统计量中,可以得到一个特定的值(检验值,在之后的步骤中我们要看这个检验值是放到)
    例如,我们计算出的相关系数r = 0.5,样本量n = 30,那么我们可以求出 t = 3.05505

  4. 由于我们知道统计量的分布情况,因此我们可以画出该分布的概率密度函数pdf,并给定一个置信水平α(愿意接受H0成立的概率),根据这个置信水平查表找到临界值,并画出检验统计量的接受域和拒绝域。
    紧接之前的例子,我们知道上述统计量服从自由度为28(30-2)的t分布,其概率密度函数图形如下:
    使用matlab绘制该概率密度函数pdf的代码如下:

     x = -4:0.1:4; % x从-4取到4间隔为0.1y = tpdf(x,28); % 第一个参数为给定的一组数据,第二个参数是自由度plot(x,y,'-') % 绘制图线grid on  % 在画出的图上加上网格线
    

    常见的置信水平有三个:90%,95%和99%,其中95%是最为常用的

    通过查t分布表,我们可知当自由度为28,置信水平为95%时,临界值为2.048,因此我们可以做出如下的接受域和拒绝域。
    [因为我们采用的是双侧检验,因为置信水平为0.95,则拒绝域之和为0.05,即,一侧为0.025。所以,其对应的t分布表中的tp = 0.975,于是再根据自由度28,即可锁定临界值2.048]

  5. 看我们在第三步得到的检验值是落在了拒绝域还是接受域,并下结论。
    在第三步中,我们得到的检验值 t = 3.05505 > 2.048*,因此我们可以下结论:在95%的置信水平上,我们拒绝原假设H0:r = 0,因此,r是显著的不为0的。

2.更好用的方法:p值判断法

  1. 何为p值?
    p值是一种概率,是拒绝原假设的最小显著性水平,是用于确定是否应该拒绝原假设的另一种方法。
  2. 如何使用?
    在上述步骤的第三步中,我们得到了一个检验值 t* = 3.05505,根据该值,我们计算其对应的p值(即,(1-红色方块区域左侧的概率),但是在本例中,由于采用的是双侧检验,因此应当×2,即(1 - 红色方块区域左侧的概率)×2)。
    matlab代码对应如下:

    disp('该检验值对应的p值为:')
    disp((1-tcdf(3.055,28)) * 2)
    % 双侧检验的p值要乘以2,tcdf是t分布的累计概率密度函数
    % tcdf(3.055,28)指x=3.055且自由度为28的累积密度函数
    

    最后我们计算得到的p值为0.0049

    p值的意义:p < 0.01,说明在99%的置信水平上拒绝原假设;p < 0.05,说明在95%的置信水平上拒绝原假设;p < 0.10,说明在90%的置信水平上拒绝原假设;
    同理,可得:p > 0.01,说明在99%的置信水平无法拒绝原假设;p > 0.05,说明在95%的置信水平无法拒绝原假设;p > 0.10,说明在90%的置信水平无法拒绝原假设。
    

    ∵ p = 0.0049 < 0.05
    ∴ 本例中,在95%的置信水平上拒绝原假设,即皮尔逊相关系数显著的异于0.

注:在论文写作中我们通常使用以下方式确定该相关系数的显著性

相关系数 " * "的意义
0.5 不显著,即无法拒绝原假设
0.5* 在90%的置信水平上显著,即在90%的置信水平上拒绝原假设
0.5** 在95%的置信水平上显著,即在95%的置信水平上拒绝原假设
0.5*** 在99%的置信水平上显著,即在99%的置信水平上拒绝原假设

三、皮尔逊相关系数检验的条件

  1. 实验数据通常是成对的来自于正态分布的总体。
    因为我们在求出皮尔逊相关系数以后,通常还会用t检验之类的方法进行皮尔逊相关系数检验,而t检验是基于数据呈正态分布的假设的
  2. 实验数据之间的差距不能太大。皮尔逊相关系数受异常值影响较大(详情见第一节图)。
  3. 每组样本之间是独立抽样的。构造t统计量时需要用到。

相关参考资料:百度百科、百度文库、清风数学建模

数学建模——相关系数(2)——假设检验相关推荐

  1. 【7.0】 数学建模 | 相关系数详解 | Person相关系数、Spearman相关系数

    总体Person相关系数 如果两组数据X:{X1,X2,⋯,Xn}和Y:{Y1,Y2,⋯,Yn}是总体数据(例如普查结果)那么总体均值:E(X)=∑i=1nXin,E(Y)=∑i=1nYin总体协方差 ...

  2. 数学建模笔记-第五讲-相关系数

    文章目录 相关系数 pearson相关系数 相关性可视化 误区 相关系数大小的解释 例题 描述性统计 matlab excel SPSS 矩阵散点图 计算相关系数 热力图美化结果 对相关系数进行假设检 ...

  3. 【清风数学建模笔记】第五讲:相关系数

    本讲我们将介绍两种最为常用的相关系数:皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数.它们可用来衡量两个变量之间的相关性的大小,根据数据满足的不同条件,我们要选择不同的相关系数进行 ...

  4. 数学建模:相关性分析学习——皮尔逊(pearson)相关系数与斯皮尔曼(spearman)相关系数

    目录 前言 一.基本概念及二者适用范围比较 1.什么是相关性分析 2.什么是相关系数 3.适用范围比较 二.相关系数 1.皮尔逊相关系数(Pearson correlation) 1.线性检验 2.正 ...

  5. 浅尝辄止_数学建模(笔记_斯皮尔曼相关系数)

    文章目录 一.斯皮尔曼spearman相关系数 1.定义(1) 2.定义(2) 3.Matlab中计算斯皮尔曼相关系数 4.斯皮尔曼相关系数的假设检验 小样本情况,即n≤30n≤30n≤30 大样本情 ...

  6. 数学建模:6 相关系数

    目录 选择哪个相关系数 总步骤 皮尔逊相关系数.假设检验 总体皮尔逊Pearson相关系数 样本皮尔逊Pearson相关系数 皮尔逊相关系数注意点 对相关系数大小的解释 皮尔逊相关系数假设检验的条件 ...

  7. 数学建模-5.相关系数

    相关系数-皮尔逊pearson相关系数 衡量两个变量之间相关性的大小 原理 协方差可以反应两个变量之间的关系,但是协方差大小与量纲有关,皮尔逊相关系数则是将X和Y标准化后的协方差,即去除了两个变量量纲 ...

  8. 《数学建模:基于R》一一2.1 回归分析

    本节书摘来自华章计算机<数学建模:基于R>一书中的第2章,第2.1节,作者:薛 毅 更多章节内容可以访问云栖社区"华章计算机"公众号查看. 2.1 回归分析 在许多实际 ...

  9. spss数据预处理步骤_数学建模准备必备的十个数据分析软件(数学建模从入门到精通)...

    前几天咋们聊了很多关于数学建模的干货,比如怎么样去前期准备学习数学建模,又比如数学建模需要哪些疾病软件?再比如数学建模论文摘要写作技巧.昨天那篇更是直接把数学建模常用的思维导图.流程图软件全部统统介绍 ...

  10. 数学建模7 多元线性回归分析

    1.回归思想 相关性(不是因果性) Y:因变量,常常是我们需要研究的核心变量,分为连续值型,0-1型,定序变量,计数变量,生存变量 X:自变量(解释变量) 回归分析:研究x和y之间的相关性的分析,尝试 ...

最新文章

  1. 云计算行业报告:2018, 风起云涌
  2. 学生兴趣爱好管理系统 c语言,《学生兴趣爱好系统.doc
  3. 没有互联网,我不会写程序了
  4. 计算机科学中的逻辑学术,简述逻辑学在计算机科学中的应用
  5. linux内核网络raw_cpu_add,深入理解Linux网络技术内幕-设备注册和初始化(四)
  6. opencv实现多个图拼接成一个图
  7. 发条js调试工具_【转载】移动端js调试工具:eruda
  8. Json格式类的转换相关代码--转载
  9. oppok3如何刷机_OPPO K3 PCGM00刷机教程,卡刷升级更新官方固件系统包
  10. python 嵌入键值数据库_键值对数据库综述
  11. 微信小程序的版本管理
  12. 通过取消反向DNS加速ssh登录速度
  13. 吕 思 伟 ---- 潘 爱 民 :: ATL 介 绍( 三)
  14. SIM卡无法识别经验案例
  15. 史上最猛“员工”,疯狂吐槽亿万富翁老板小扎:那么有钱,还总穿着同样的衣服!
  16. Vue2.0的页面模板
  17. WiFi、WiMAX、WBMA与3G的比较
  18. 倒计时2天 校园行|AI TIME “未来杯” 走进浙江大学
  19. dota2游戏c语言,新手科普:Dota2操作按键设置和游戏设置详解
  20. php带参 输出图片,如何自动显示图片在拍摄时的一些参数(转)

热门文章

  1. sougou ubuntu 优麒麟_Ubuntu20.04LTS安装搜狗输入法
  2. pvacseq数据分析示例之准备数据,用VEP注释vcffile
  3. 本特利990-05-50-02-00变送器
  4. 道路照明智能监控用5G智慧灯杆网关
  5. 软考高级网络规划设计师历年论文真题汇总2009-2021
  6. php注册后面有对号错号,jQuery Ajax显示对号和错号用于验证输入验证码是否正确...
  7. 应用随机过程笔记(二):泊松过程
  8. 清华学霸尹成Python爬虫视频 [MP4] (33.96G)
  9. 一拳超人手游显示服务器断开,一拳超人最强之男游戏无法登陆怎么办 解决方案一览...
  10. 免费 WebOffice使用