本文主要记录了python对数据进行相关性统计检验的实现方法。

主要是:

1、连续变量VS连续变量:皮尔逊相关系数

2、分类变量VS分类变量:卡方检验

3、连续变量VS多分类变量:F检验

4、连续变量VS二分类变量:若连续变量满足正态分布,则用t检验,否则应用曼-惠特尼U检验

主要的python脚本如下:

from sklearn.feature_selection import SelectKBest,chi2
from scipy import stats
from  scipy.stats import ttest_ind, levenedef corr_continue_continue(series_1,series_2):corr = pearsonr(series_1,series_2)[1]return corr
def corr_cate_cate(series_1,series_2):series_1 = np.array(series_1).reshape(-1,1)model1 = SelectKBest(chi2, k=1)model1.fit_transform(series_1, series_2)corr = model1.scores_[0]p_value = model1.pvalues_[0]return corr,p_value
def corr_continue_multicate(fenlei_series_1,lianxu_series_2):f,p = stats.f_oneway(fenlei_series_1,lianxu_series_2)return f,p
def normal_test(series):u = series.mean()std = series.std()statistic,pvalue = stats.kstest(series,'norm',(u,std))return statistic,pvalue
def corr_continue_twocate(data,fenlei_var,lianxu_var):fenlei = list(set(data[fenlei_var]))series_1 = data[lianxu_var][data[fenlei_var]==fenlei[0]]series_2 = data[lianxu_var][data[fenlei_var]==fenlei[1]]stats_1,pvalue_1 = normal_test(series_1)stats_2,pvalue_2 = normal_test(series_2)if pvalue_1 < 0.05 or pvalue_2 < 0.05:t_value,p_value = stats.mannwhitneyu(series_1,series_2,alternative='two-sided')else:_,levene_p_value = levene(series_1,series_2)if levene_p_value>0.05:t_value,p_value = ttest_ind(series_1,series_2)else:t_value,p_value = ttest_ind(series_1,series_2,equal_var=False)return t_value,p_value,pvalue_1,pvalue_2

运用python进行相关性统计检验相关推荐

  1. python进行各项统计检验_运用python进行相关性统计检验

    本文主要记录了python对数据进行相关性统计检验的实现方法. 主要是: 1.连续变量VS连续变量:皮尔逊相关系数 2.分类变量VS分类变量:卡方检验 3.连续变量VS多分类变量:F检验 4.连续变量 ...

  2. python 相关性分析_数据分析---用Python进行相关性分析(兼谈假设检验)

    一.相关关系和相关系数 世上除了因果关系,还有相关关系. 有一个叫"相关系数"的指标来量化两个事物之间的相关程度. 其中相关系数用"r"表示,取值范围介于-1和 ...

  3. 如何用python进行相关性分析_Python 数据相关性分析

    概述 在我们的工作中,会有一个这样的场景,有若干数据罗列在我们的面前,这组数据相互之间可能会存在一些联系,可能是此增彼涨,或者是负相关,也可能是没有关联,那么我们就需要一种能把这种关联性定量的工具来对 ...

  4. 如何用python进行相关性分析_Python文章相关性分析---金庸武侠小说分析

    最近常听同事提及相关性分析,正巧看到这个google的开源库,并把相关操作与调试结果记录下来. 小说集可以百度<金庸小说全集 14部>全(TXT)作者:金庸 下载下来. 需要整理好格式,门 ...

  5. Python特征分析- 相关性分析

    Python特征分析- 相关性分析 相关性分析 引入库 图示初判 变量之间的线性相关性 散点图矩阵初判多变量间关系 Pearson相关系数 创建样本数据 正态性检验 → pvalue >0.05 ...

  6. 几组数据的相关性python_数据分析---用Python进行相关性分析(兼谈假设检验)

    一.相关关系和相关系数 世上除了因果关系,还有相关关系. 有一个叫"相关系数"的指标来量化两个事物之间的相关程度. 其中相关系数用"r"表示,取值范围介于-1和 ...

  7. Python数据相关性分析

    概述 在我们的工作中,会有一个这样的场景,有若干数据罗列在我们的面前,这组数据相互之间可能会存在一些联系,可能是此增彼涨,或者是负相关,也可能是没有关联,那么我们就需要一种能把这种关联性定量的工具来对 ...

  8. 如何用python进行相关性分析_如何利用python进行时间序列分析

    题记:毕业一年多天天coding,好久没写paper了.在这动荡的日子里,也希望写点东西让自己静一静.恰好前段时间用python做了一点时间序列方面的东西,有一丁点心得体会想和大家分享下.在此也要特别 ...

  9. python绘制相关性矩阵_python seaborn heatmap可视化相关性矩阵实例

    方法import pandas as pd import numpy as np import seaborn as sns df = pd.DataFrame(np.random.randn(50) ...

  10. Python笔记-相关性分析(连续变量和分类变量)

    概念 相关性分析:两个连续变量之间的关系检验. Pearson相关系数:衡量两个变量的线性相关关系: Spearman相关系数:衡量两个变量的线性相关关系,部分非线性的也可以衡量: Kendall相关 ...

最新文章

  1. java求最大公约数(分解质因数)
  2. java中封装日期加时间_java日期处理简单封装
  3. 简述抽象和封装,对你学习Java有一些作用
  4. 怎么安装redhat linux操作系统,红帽RedHat Linux5系统安装指南
  5. 回溯法 —— 求解0/1背包问题(剪枝)
  6. Zookeeeper开源客户端curator watcherAPI的使用
  7. python怎么做一个动态烟花_简单烟花效果.py python firework demo
  8. 查看 Visio 是否激活以及激活方法
  9. 听比喻,懂原理(1)超五类双绞线和六类双绞线的区别
  10. eclipse juno(4.2) 集成 maven 插件
  11. [Python核心技术与实战学习] 18 单元测试unittest 库
  12. 转换罗马数字,输入一串数字字符串,将其转化为希腊字符串。
  13. vue进入浏览器大屏
  14. windows10利用驱动精灵更新网卡后,笔记本的有线网卡和无线网卡一直安装不成功,错误代码:56的完美解决办法(不需要重装系统,轻松解决)
  15. 使用HTML5中的Canvas API绘制出一个足球
  16. 便携式激励vs形式化vsUVM验证方法在IP块的整个生命周期中的比较分析
  17. Apache-ab安装使用
  18. 信息技术用计算机写字的教案,黔教版信息技术三年级下册第9课《用计算机写字》教案1.doc...
  19. Educational Codeforces Round 147 (Rated for Div. 2) 题解
  20. 官方最新版teamview15.5.3.exe

热门文章

  1. 寿司大厨Sushiswap挥刀Uniswap背后:或将消灭传统VC
  2. Elasticsearch:管理悬空(dangling)索引
  3. 计算机集成制造ppt英语,计算机集成制造cims
  4. 马云:未来制造业要的不是石油 最大的能源是数据
  5. 智能化工厂数字化管理系统软件解决方案
  6. word表格一行不对齐解决方法
  7. word导航窗显示二级目录
  8. JS获取下个月的第一天和最后一天
  9. QCC3040---AppDevice module
  10. D630,vista sp2,4GB Turbo Memory,ITMService.exe(SmartPinService),Posses lots of CPU Resources