前言

相关系数是用以反映变量之间的相关关系程度的统计指标。其取值范围是[-1,1],当取值为0时表示不相关,取值为[-1,0)表示负相关,取值为(0,-1],表示负相关。
目前常用的两种相关性系数为皮尔森相关系数(Pearson)和斯皮尔曼等级相关系数(Spearman)

简介

  1. 皮尔森相关系数评估两个连续变量之间的线性关系。
    其中:

    -1 ≤ p ≤ 1
    p接近0代表无相关性
    p接近1或-1代表强相关性

  2. 斯皮尔曼相关系数评估两个连续变量之间的单调关系。在单调关系中,变量趋于一起变化,但不一定以恒定速率变化。

    其中:

    N是观测值的总数量

斯皮尔曼另一种表达公式:


表示二列成对变量的等级差数。

区别

Pearson和Spearman相关系数的范围可以从-1到+1。当Pearson相关系数为+1时,意味着,当一个变量增加时,另一个变量增加一致量。这形成了一种递增的直线。在这种情况下,Spearman相关系数也是+1。

如果关系是一个变量在另一个变量增加时增加,但数量不一致,则Pearson相关系数为正但小于+1。在这种情况下,斯皮尔曼系数仍然等于+1。

当关系是随机的或不存在时,则两个相关系数几乎为零。

如果关系递减的直线,那么两个相关系数都是-1。

如果关系是一个变量在另一个变量增加时减少,但数量不一致,则Pearson相关系数为负但大于-1。在这种情况下,斯皮尔曼系数仍然等于-1

相关值-1或1意味着精确的线性关系,如圆的半径和圆周之间的关系。然而,相关值的实际价值在于量化不完美的关系。发现两个变量是相关的经常通知回归分析,该分析试图更多地描述这种类型的关系。

其他非线性关系
Pearson相关系数仅评估线性关系。Spearman相关系数仅评估单调关系。因此,即使相关系数为0,也可以存在有意义的关系。检查散点图以确定关系的形式。

该图显示了非常强的关系。Pearson系数和Spearman系数均约为0。

结论

皮尔森评估的是两个变量的线性关系,而斯皮尔曼评估的两变量的单调关系。
因此,斯皮尔曼相关系数对于数据错误和极端值的反应不敏感。

Pearson相关系数和Spearman相关系数的区别相关推荐

  1. pearson相关系数与spearman相关系数

    pearson相关系数 研究变量之间 线性相关 程度的量,一般用r表示. 两个随机变量X,Y之间的pearson相关系数定义为: ρX,Y=cov(X,Y)σXσY=E[(X−μX)(Y−μY)]σX ...

  2. 特征选择 | MATLAB实现特征变量相关性分析(Pearson相关系数,Kendall相关系数和Spearman相关系数)

    特征选择 | MATLAB实现特征变量相关性分析(Pearson相关系数,Kendall相关系数和Spearman相关系数) 目录 特征选择 | MATLAB实现特征变量相关性分析(Pearson相关 ...

  3. 【7.0】 数学建模 | 相关系数详解 | Person相关系数、Spearman相关系数

    总体Person相关系数 如果两组数据X:{X1,X2,⋯,Xn}和Y:{Y1,Y2,⋯,Yn}是总体数据(例如普查结果)那么总体均值:E(X)=∑i=1nXin,E(Y)=∑i=1nYin总体协方差 ...

  4. [学习笔记] [机器学习] 8. 聚类算法(聚类算法:K-means、K-means++;聚类算法评估;特征降维:特征选择(Pearson相关系数、Spearman相关系数)、PCA主成分分析)

    视频链接 数据集下载地址:无需下载 1. 聚类算法简介 学习目标: 掌握聚类算法实现过程 知道 K-means 算法原理 知道聚类算法中的评估模型 说明 K-means 的优缺点 了解聚类中的算法优化 ...

  5. 皮尔森 统计学相关性分析_pearson相关系数和spearman相关系数的区别

    展开全部 区别: 1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,效率没有62616964757a686964616fe78988e69d83 ...

  6. 皮尔逊(Pearson)相关系数与spearman相关系数(Python实现)

    概念介绍 相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度. 相关系数大小解释 相关性 绝对值 无相关 0 - 0.09 弱相关 0.1 - 0.3 中相关 0.3 - 0.5 强相关 ...

  7. python spearman相关系数_Python spearman相关系数不匹配 .

    所以我有一个数据集,它是分子丰度作为物理参数的函数,我想确定两者之间的相互关系 . 这两个参数都跨越了几个数量级 . 因为两者不是线性相关的,所以我选择使用 scipy.stats.spearmanr ...

  8. pearson和spearman相关系数

    文章目录 一.pearson相关系数 二.spearman相关系数 三.两者区别 一.pearson相关系数 评估两个连续变量之间的***相关关系,计算公式如下 二.spearman相关系数 斯皮尔曼 ...

  9. ML之PPMCC:PPMCC皮尔逊相关系数(Pearson correlation coefficient)、Spearman相关系数的简介、案例应用之详细攻略

    ML之PPMCC:PPMCC皮尔逊相关系数(Pearson correlation coefficient).Spearman相关系数的简介.案例应用之详细攻略 目录 PPMCC皮尔逊相关系数的简介 ...

最新文章

  1. Silverlight 3.0 Beta版 正式发布
  2. 利用Delphi的File Of Type创建并管理属于你自己的数据库
  3. Redis为什么使用单进程单线程方式也这么快
  4. nodejs开发游戏服务器遇到的性能问题
  5. linux-防火墙有关知识积累
  6. 使用sqlserver搭建高可用双机热备的Quartz集群部署【附源码】
  7. gc垃圾收集器 与gc算法_GC解释:收集器概述
  8. android 热修复视频,Android热修复
  9. java获取新insert数据自增id_java获取新insert数据自增id的实现方法
  10. android日期选择区间控件_Android日期时间选择器实现以及自定义大小
  11. 如何在 Laravel 中 “规范” 的开发验证码发送功能
  12. 零基础学习 Python 之前期准备
  13. python输入学生成绩、分a、b、c类_在Python中,如果输入a=1b=2c=acc=b,那么c的值是多少?c指的是什么?...
  14. Git 查看本地分支关联的远程分支 git branch -vv
  15. 数据中心规划设计参考-(文章以GB 50174为参考基准)
  16. kali linux安装maven
  17. 转行做软件测试的原因
  18. 小米手机系统wifi服务器,手机时间变慢,小米高管科普:3招即可解决
  19. 解剖 Facebook 底层
  20. Easyexcel 获取表格具体位置的内容

热门文章

  1. 数字化时代-23:中国人工智能企业100强排行榜
  2. Netflix:通过自适应音频码率提升音频体验
  3. DIY小型室外气象站,实时监测气象情况
  4. python爬虫多线程书籍_Python爬虫入门【10】:电子书多线程爬取
  5. springboot 文件下载,总是默认返回zip格式文件
  6. CodeTON Round 4 (Div. 1 + Div. 2, Rated, Prizes!) (D,E)
  7. vs2017 有时候双击打不开解决办法
  8. 【脱普】电阻分类、电阻常用参数、贴片电阻封装、电阻功能、阻值识读
  9. TTL值的含义以及与域名DNS TTL值的区别
  10. HTML thead tbody tfood