import os
import pandas as pd"""
检验其他变量是否跟avg_exp有关
avg_exp是连续变量,作为因变量; 研究自变量类型对avg_exp的影响
1. 自变量是二分类变量     两样本T检验
2. 自变量是多分类变量      方差分析
3. 自变量是连续变量       相关分析"""os.chdir(r'D:\pycharm程序文件\练习1')
data = pd.read_csv("creditcard_exp.csv")print(data.shape)"""
income ~ Acc 收入是否影响开卡原假设是 :  收入不影响开卡, 也即是 开卡的人收入 == 不开卡的人收入"""
# 用groupby()来找出分类变量和连续变量的关系   用法: 连续变量.groupby(分类变量).连续变量的统计量函数
# 如: data1.groupby(data2).mean() 表示: 将 data2中每一类变量对应的data1的值进行求均值, 以dataframe的形式输出
group = data.Income.groupby(data.Acc).describe()
# print(group)
"""
输出结果:count      mean       std    ...          50%       75%       max
Acc                               ...
0     30.0  3.149333  1.406482    ...     2.905000  3.807500   8.40000
1     70.0  7.424706  3.077986    ...     6.443525  8.494237  16.90015"""
# ['Acc']==0表示不开卡
data1 = data[data['Acc']==0]['Income'] # 将不开卡人的收入赋值给data1
data2 = data[data['Acc']==1]['Income'] # 将开卡人的收入赋值给data2from scipy import stats# 查看 两样本t检验(假设检验) 的 t值和p值,用于判断是否接受原假设
t_and_p = stats.stats.ttest_ind(data1,data2)
print(t_and_p)
"""
输出结果:
(statistic=-7.2734332066230225, pvalue=8.690094133636065e-11)
样本数量是100,α 取值为0.05, p值远小于α值, 所以拒接原假设""""""
两样本T检验(二分类变量~连续变量)练习:
1. 查看性别对收入是否有影响 gender~Income
2. Ownrent~Income
3. Selfempl~Income"""print( data['Income'].groupby(data['gender']).describe() )
print( data['Income'].groupby(data['Ownrent']).agg(['mean','median','max']) )
print( data['Income'].groupby(data['Selfempl']).agg(['mean','median']) )# 查看性别对收入是否有影响 gender~Income
gender1 = data[data['gender']==1]['Income']
gender0 = data[data['gender']==0]['Income']
# 求t,p值
t_p_value_g = stats.stats.ttest_ind(gender0,gender1)
print("t,p值 {}".format(t_p_value_g))# Ownrent~Income
Ownrent1 =data[data['Ownrent']==1]['Income']
Ownrent0 =data[data['Ownrent']==0]['Income']t_p_value_o = stats.stats.ttest_ind(Ownrent0,Ownrent1)
print(t_p_value_o)

python 两样本T检验相关推荐

  1. spss和sas和python_T检验第三篇(SPSS,SAS,R,Python) 两样本T检验

    两样本T检验,和终于来到T检验的最后一个章节,两样本T检验. 两样本T检验的应用条件为:1.独立的随机样本 2.资料应当服从正态分布 3.方差齐性 即我们要在前面两种T检验的前提下,做多一个方差齐性检 ...

  2. python双样本t检验_SPSS详细操作 两个样本均数比较的t检验

    一.问题与数据 随机抽取20只小鼠分配到A.B两个不同饲料组.每组 10 只,喂养一定时间后,测得鼠肝中铁的含量(μg/g),数据如下.试问不同饲料对鼠肝中铁的含量有无影响? 二.对数据结构的分析 整 ...

  3. python双样本t检验_两样本t检验的scipy实现

    以真实商业案例为数据基础,课程内容围绕scipy.stats和statsmodels包的相关功能展开,从统计分析实战的角度出发详细介绍了如何在Python中完成数据描述.t检验.单因素方差分析.卡方检 ...

  4. 十二、非参数检验:使用python进行两样本Wilcoxon秩和检验法和Mann-Whitney U检验

    除了使用Wilcoxon进行单样本位置检验外,其实也可以使用wilcoxon进行两样本位置检验,基本原理与单样本中心位置检验一样:将来组容量相等的样本值做差,然后分别计算差值中为负数的秩和( R − ...

  5. cc和毫升换算_毫升学生两个样本配对样本t检验不

    cc和毫升换算 In Z-test, we assume we know the standard deviation of the population. What if we don't know ...

  6. Python4班平均成绩统计_医学统计软件应用——SPSS(四) 配对样本及两独立样本t检验...

    t检验多用于两组连续性变量样本均数的比较.例如,研究两地正常成年男性血液红细胞均数的差别,两个班级期末考试成绩之间的差别.配对样本是比较特殊的,配对样本是指两个样本中的观察值由于存在某种联系而一一对应 ...

  7. Excel双样本T检验之成对检验

    Excel双样本T检验之成对检验 1 声明 本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理. 2 双样本T检验之成对检验简介 独立样本中两样本 ...

  8. 格兰杰因果关系检验r语言_R语言系列第四期:R语言单样本双样本差异性检验

    之前详细介绍了利用R语言进行统计描述,详情点击:R语言系列第三期:①R语言单组汇总及图形展示.R语言系列第三期:②R语言多组汇总及图形展示.R语言系列第三期:③R语言表格及其图形展示 从这个部分我们就 ...

  9. 单样本和双样本的检验

    1.1 单样本t检验 t检验假设数据来自于一个正态分布. > daily.intake <- c(5260, 5470, 5640, 6180, 6390, 6515, 6805, 751 ...

最新文章

  1. python求平均成绩 输入用空格分隔的两个代码_在Python2.7中,如何计算以空格分隔的多个输入?...
  2. AS3中 is,as,typeof的区别 .
  3. C语言学习之从键盘输入任意一个字母,输出它的对应大(小)写
  4. Hbase 的javaAPI基本操作用 在idea上的实现
  5. js生成一周内的日期+周几
  6. 实现Trie(前缀树)
  7. 第103篇Python:Python爬虫系列之书籍爬取,细节拉满
  8. System.Security.Cryptography.RSA.FromXmlString 系统找不到指定的文件和X509读取证书文件系统找不到指定的文件异常
  9. linux unzip 解压到当前目录,Linux unzip命令详解
  10. 计算机专业窗体的事件何时触发,高三计算机专业VB试题(七)
  11. c4d流体插件_C4D的Jet Fluids免费流体插件
  12. 北大青鸟(邯郸翱翔)网络校区
  13. app不走系统代理?如何抓包?
  14. vendor php,使用php composer时, 如何优雅修改vendor中第三方代码
  15. Data Catalog3.0:Modern Metadata for the Modern Data Stack
  16. “算丰AI视界”人工智能技术内容征集活动正式开启!
  17. 详解+推导 神经网络中的前向传播和反向传播公式(神经网络中的梯度下降)
  18. python彼岸图网爬取1200像素预览图
  19. postgres-----pgrouting
  20. Axure 8.1.0.3377 注册激活码

热门文章

  1. 2019年独角兽企业榜单,中美依然霸榜
  2. 兮米安装包制作工具绿色版
  3. JavaSE · 常量介绍 · 变量类型转换 · 理解数值提升 · int 和 Stirng 之间的相互转换
  4. 【JAVA】超简单的1-100猜数字小游戏
  5. ubuntu升级python版本_ubuntu升级python版本
  6. js 比较时间大小.html
  7. 汇众教育、暴风影音虚拟现实(VR)来袭
  8. 医院预约挂号系统设计与实现(论文+源码)
  9. animate.css引入实现动画效果
  10. WaitForSingleObject CreateProcess